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本 书 将 介绍 博弈 论 的 基础 知识 , 它 分 为 多 个 层次 , 既 可 作为 教材 ,也 可 供 社会 大 众 
浅 读 。 

所 谓 博弈 论 ,是 研究 多 个 主体 之 间 如 何 根 据 对 方 的 行动 做 出 策略 反应 的 理论 , 意 即 研 
究 多 个 主体 之 间 策略 互动 的 理论 。 它 是 讨论 行为 与 动机 、 竞 争 与 合作 以 及 机 制 设计 的 理 
论 基 础 。 

自 20 世纪 中 叶 始 ,博弈 论 已 发 展 成 为 一 个 体系 完善 .细节 丰富 、 学 科 交 叉 的 分 析 工 
有 具 ,对 政治 军事 、 经 济 管 理工 作 生 活力 至 生物 进化 等 诸多 现象 都 具有 普遍 适用 性 。 随 之 ， 
对 博弈 论 知识 的 渴求 已 不 再 局 限于 经 济 管理 专业 的 学 生 , 理 工 文法 等 专业 的 学 生 和 社会 
读者 也 都 期 望 学 习 一 二 。 然 而 ,作为 通 识 教育 而 设立 的 相关 课程 在 国内 尚 属 少 数 , 有 针对 
性 的 教材 或 读物 则 更 为 少见 。 

编著 者 从 多 年 的 经 历 中 发 现 ,尽管 来 自 不 同 专业 的 众多 学 生 对 博弈 论 饱 含 好 奇 和 激 
情 ,但 是 在 初学 或 咨询 之 后 ,激情 却 骤 然 下 降 。 究 其 原因 ,多 数 人 认为 博弈 理论 深奥 难 学 ， 
因此 中 途 退 却 。 一 般 来 说 ,熟练 掌握 博弈 论 需 要 具备 高 等 数学 基础 和 抽象 分 析 能 力 。 因 
此 ,目前 的 教授 对 象 主要 集中 在 数学 ,经济 ,管理 等 专业 的 高 年 级 本 科 生 和 研究 生 , 很 少 扩 
展 到 大 中 专 院 校 的 普通 学 生 和 社会 大 众 。 那 么 ,如 何 将 丰富 多 彩 的 博弈 知识 和 简单 实用 
的 博弈 要 义 传授 给 毫 无 专业 基础 的 初学 者 ? 这 是 编著 者 近 些 年 的 探索 和 持续 努力 的 方 
向 。 毕 竞 课 堂 传授 非常 有 限 , 而 编写 一 部 由 浅 入 深 、 情 节 丰 富 的 入 门 级 教材 或 读物 , 则 既 
能 吸引 读者 阅读 ,又 能 启发 读者 思考 、 温 故 知 新 。 

就 非 专业 学 习 而 言 ,高 校 学 生 和 同等 学 历 的 读者 在 学 习 博 弈 论 时 表现 出 的 特点 是 : 富 
有 热情 .长 于 思辩 ,但 怕 抽 象 、 难 持久 。 因 此 ,本 书 针对 上 述 特 点 ,紧密 结合 现实 场景 ,由 浅 
入 深 地 介绍 博弈 论 知 识 。 编 著者 还 创新 写作 风格 ,避免 枯燥 上 涩 的 同时 又 不 失 严肃 。 

具体 而 言 ,本 书 的 创新 有 三 。 第 一 ,调整 知识 侧重 点 ,在 内 容 上 适当 弱化 理论 推导 和 
符号 演绎 ,提升 知识 的 应 用 性 和 通 识 性 。 即 便 不 可 避免 地 涉及 理论 分 析 和 抽象 概念 ,也 是 
先 由 故事 或 案例 开始 ,再 引入 简单 模型 和 通俗 定义 ,然后 才 是 抽象 概念 和 符号 演绎 。 第 
二 ,创新 写作 风格 ,本 书 将 艰 涩 理论 生动 化 ,形象 化 ,使 理论 与 现实 紧密 结合 .相互 渗透 ,而 
不 仅仅 纵 以 读者 “夹心 面包 ”。 除 了 系统 的 知识 体系 外 ,本 书 中 还 有 导出 模型 的 引 语 故 事 、 
源 出 现实 的 案例 分 析 、 辅 助理 解 的 扩展 阅读 、 深 入 学 习 的 进 阶 阅读 ,等 等 。 第 三 , 书 中 的 许 
多 案例 都 是 全 新 的 ,都 经 过 编著 者 的 精心 编排 和 努力 耕耘 ,使 之 更 贴近 读者 的 知识 结构 。 

编著 者 中 既 有 教学 经 验 丰富 的 老 教师 ,也 有 创造 力 旺 盛 的 年 轻 人 。 在 编写 过 程 中 , 葛 
泽 慧 与 何 维 达 教授 共同 负责 章节 安排 ,内 容 选编 ,修改 审 校 等 全 局 性 工作 。 具 体 到 各 章 编 
写 ,主要 分 工 如 下 。 
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第 1 章 葛 泽 慧 、 于 艾 琳 。 

第 2 章 丁 云 培 , 冯 世 豪 . 赵 瑞 。 

第 3 章 冯 世 豪 、 于 艾 琳 、 赵 瑞 。 

第 4 章 于 艾 琳 、 葛 泽 慧 。 

第 5 章 邓 文 聪 . 葛 泽 慧 、 于 艾 琳 、 赵 瑞 。 

第 6 章 于 艾 琳 、 葛 泽 慧 。 

第 7 章 赵 瑞 , 汉 世 豪 。 

第 8 章 冯 世 豪 、 赵 瑞 。 

附录 ,版 式 ,协调 由 赵 瑞 负责 ,参考 文献 ` 名 词 索引 由 魏 傲 宇 负责 。 胡 跃 光 . 肖 受 如 、 陈 
书 清 \ 任 新 宇 、 白 梦 迪 和 张 饮 等 在 早期 版 本 中 也 做 出 了 奠基 性 贡献 。 所 有 人 的 贡献 都 非常 
重要 , 缺 一 不 可 。 另 外 ,本 书 已 经 列 入 北京 科技 大 学 “十 三 五 ”规划 教材 ,本 书 的 编写 得 到 
了 北京 科技 大 学 教材 建设 经 费 的 资助 。 

书 中 标注 * 号 的 章节 为 选 讲 内 容 或 进 阶 内 容 , 在 课堂 讲授 中 不 作 基 本 要 求 。 若 见 章 
和 节 同 时 标注 * 号 的 ,表示 选 讲 章 中 具有 选 讲 节 , 即 若 讲解 该 章 , 仍 可 进一步 将 标 * 节 作 
为 选 讲 。 

由 于 编著 者 水 平 有 限 ,错误 在 所 难免 ,还 请 您 不 音 赐 教 。 交 流 邮 箱 是 gezehui_jx@ 
163. com 。 


现在 ,请 您 进入 精彩 的 博弈 世界 ! 


葛 泽 起 
2018 年 1 月 25 日 
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信号 博弈 : 你 的 眼睛 背叛 了 你 的 心 * 
博取 声誉 : 真实 还 是 伪装 * 


重复 博弈 及 其 特点 … 
构建 重复 博弈 ， 

信息 不 对 称 下 的 重复 博弈 * 
重复 博弈 的 进一步 讨论 ， 


演化 博弈 ” 
“向 前 看 "还 是 “向 后 看 ” 


六 尼 与 演 北 稳定 第 几 700d od 


种 常见 的 演化 机 制 * 


竞争 与 合作 


协调 以 避免 竞争 sesso000so0 soo ooo esosoo sor oo oo osooo oso esosooo so seroo0 oo ser sos ooooes 
pe sh NR 


合作 博弈 应 用 举例 * 


于 你 而 言 , 博 弈 也 许 既 熟悉 又 陌生 , 既 亲 近 又 路 远 ; 它 既 包括 工作 的 行动 方略 ,也 涉 
及 生活 的 柴米油盐 。 无 论 古 时 征战 沙场 的 运筹 肉 怪 ,还 是 现代 日 进 斗 金 的 股票 交易 ,抑或 
孤 注 一 搓 的 足球 博彩 ,更 甚 团体 内 部 的 拉 帮 结 派 ,它们 都 只 是 浩瀚 博弈 世界 的 惊 渔 一 珂 。 

博弈 论 , 简 言 之 就 是 有 关 博 弈 的 理论 ,实际 是 研究 行为 互动 的 理论 。 它 起 源 于 游戏 赌 
胜 , 深 化 于 政治 军事 ,发 展 于 经 济 生 活 。 在 我 们 的 历史 中 ,许多 成 语 典故 都 在 讲述 着 博弈 
的 精彩 :“ 免 死 狗 访 ” 的 政治 谍 算 “ 退 避 三 会 ”的 机 智 干 旋 “ 田 忌 赛 马 ” 的 另辟蹊径 等 。 而 
对 年 轻 的 读者 而 言 ,现代 影视 作品 中 也 不 乏 生动 的 场景 :《 纸 牌 屋 兴 权力 的 游戏 ) 中 的 权 
谋 之 争 ,( 决 战 21 点 兴 亿 万 》 中 的 智者 对 决 人 美丽 心灵 兴 大 话 西游 } 中 的 真情 流露 ,等 等 。 
博弈 论 虽然 隶属 于 经 济 学 ,但 它 在 政治 学 、 社 会 学 \ 心 理学 等 诸多 领域 都 散发 着 光彩 。 从 
两 党 制衡 的 政治 格局 ,到 趋同 定价 的 商业 现象 ,再 到 是 否 “ 私 奔 ” 的 婚姻 抉择 ,其 至“ 见 死 不 
救 ” 的 心理 演化 ,都 能 够 管 中 宇 鹏 ,可 见 一 斑 。 

那么 ,应当 如 何 从 具体 场景 开始 建立 博弈 的 基本 概念 ? 又 该 如 何 从 纷繁 复杂 的 现象 
中 确立 一 般 性 的 分 析 方法 ? 你 知道 博弈 的 分 类 和 历史 吗 ? 让 我 们 走 进 本 章 , 初 见 博弈 论 

相信 你 已 经 翻 看 了 本 书 的 内 容 简介 和 前 言 , 对 本 书 的 话题 有 所 了 解 。 在 即将 开始 一 
个 生动 有 趣 、 细 节 丰 富 的 话题 之 前 ,请 先 看 如 下 两 个 故事 。 

第 一 个 故事 来 自 张 小 娴 的 爱情 散文 4 谢谢 你 离开 我 》, 讲 述 了 主人 公 的 恋爱 表白 过 程 。 

一 天 晚上 ,他 又 “准时 报到 ”, 在 电话 里 跟 你 天 南 地 北 。 你 们 说 着 说 着 ,到 了 夜 阅 人 静 
的 时 候 , 话 题 绕 到 了 爱情 。 在 你 “诱导 ”下 ,他 有 意 无 意 地 掉 进 了 你 设 下 的 “陷阱 ”, 终 于 ,他 
状 涩 地 向 你 坦诚 ,他 喜欢 上 了 一 个 女孩 子 。 

“是 谁 呀 ?” 

他 结 结巴 巴 地 说 :“ 你 是 知道 的 。” 

你 笑 了 笑 ,说 :“ 你 不 说 ,我 怎么 知道 ?” 

他 采 腊 地 重复 一 遍 :“ 你 这 么 聪明 ,一 定 能 猜 到 我 说 的 是 谁 。 

但 你 就 是 不 肯 猜 , 非 要 他 亲口 说 出 来 不 可 。 要 是 他 连 表 和 白 的 勇气 都 没有 ,就 不 配 
爱 你 。 

终于 ,他 深情 款 款 地 说 :“ 我 喜欢 你 。” 

就 在 他 表白 的 那 一 刻 ,你 对 着 电话 简 甜 甜 地 笑 了 。 

第 二 个 故事 出 自 ( 三 国 演义 ), 说 的 是 诸葛 亮 打 破 司 马 过 的 固守 战略 , 诱 敌 出 战 并 将 他 
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围困 于 上 方 谷中 。 

rss 司马 雍 详 细 问 明 甬 营 的 活动 后 , 吟 啥 诸 将 于 次 日 齐 力 攻 取 祁 山大 寨 。 

司马 师 问 :“ 父 亲 为 何不 直 取 上 方 谷 ,反攻 其 后 ?” 

答 : “祁山 乃 甬 军 根本 ,车 见 我 军 来 攻 , 必 会 尽力 来 救 ; 而 我 却 去 上 方 谷 烧 粮 , 使 他 们 
首尾 不 能 相 顾 ,一 定 大 败 1” 

且说 孔明 正在 山上 , 望 见 魏 兵 队伍 三 三 两 两 ,前 后 顾盼 , 料 定 是 来 取 祁 山 的 。 于 是 秘 
传 众 将 , 众 将 各 自 听 令 而 去 。 

不 多 时 ,只 见 罚 军 奔走 呐喊 ,奋力 营救 (假意 ) 。 司 马 邯 见 罚 兵 都 去 营救 , 便 领 着 两 个 
儿子 和 中 军 杀 奔 上 方 谷 。 早 有 魏延 在 谷口 等 候 , 只 了 盼 司马 喜 到 来 。 二 军 相 见 只 有 三 个 回 
合 , 魏 延 便 诈 败 而 逃 。 

司马 就 见 只 有 魏延 一 人 ,军马 又 少 ,于 是 放心 追 去 。 追 到 谷口 , 先 令 人 到 谷中 哨 探 。 
回报 并 无 伏兵 ,山上 都 是 草 房 。 司马 率 断 定 必 是 记 粮 之 所 ,于 是 倾 兵 而 入 。 追 着 追 着 , 司 
马 就 忽然 发 现 草 房 上 全 是 干 业 ,而 魏延 早已 不 见 。 心 中 狐疑 ,于 是 问 两 个 儿子 :“ 若 有 兵 
截断 谷口 ,该 怎么 办 ?” 

言 未 毕 , 忽 听 喊 声 大 震 , 火 把 齐 飞 , 烧 断 了 谷口 。 一 时 间 , 干 业 尽 燃 ,火势 冲天 。 魏 军 
顿时 乱 作 一 团 ,村 路 逃窜 。 惊 得 司马 素 手 足 无 措 , 下 马 抱 着 两 个 儿子 大 句 ;“ 我 父子 三 人 
起 死 于 此 处 矣 1”…… 

这 两 个 故事 给 人 的 感觉 截然 不 同 。 前 者 是 温情 脉 脉 ,每 个 人 都 可 能 
过 到 的 爱情 故事 ; 后 者 是 谋事 切切 ,政治 军事 家 们 所 追求 的 斗争 智慧 。 
但 是 无 论 哪个 ,都 不 是 冷冰冰 的 文字 。 这 些 情节 都 或 多 或 少 地 映射 着 你 
的 生活 情景 和 行为 方式 。 

诸如 此 类 的 事情 ,生活 中 还 会 遇 到 很 多 : 如 何 应 对 舍 友 的 不 良 习 
惯 , 如 何 确定 男 ( 女 ) 友 是 否 真 心爱 你 ”怎样 才能 在 一 次 项 目 申 请 答辩 中 
战胜 对 手 ,怎样 才能 管理 好 团队 中 的 “懒汉 ”和 "* 刺 儿 头 ?? 为 什么 公共 厕所 的 厕 纸 会 消耗 
得 特别 快 , 而 开源 软件 并 没有 像 一 些 人 预测 的 那样 迅速 消失 ? 等 等 。 这 些 都 只 不 过 是 重 
大 决策 中 的 几 个 例子 。 这 些 情节 看 似 毫 不 相关 ,但 是 却 有 一 个 共同 的 特征 : 你 不 是 面 对 
着 一 堆 “ 死 的 "数学 、 物 理 世 界 在 做 决策 ,而 是 处 于 一 群 和 你 一 样 主动 的 、 智 能 的 决策 者 之 
中 ,你 们 的 行为 将 相互 依赖 .相互 作用 。 我 们 将 这 种 决策 主体 间 具 有 直接 相互 作用 的 行为 
称 作 互动 行为 。 这 种 互动 行为 将 对 你 的 思维 和 行动 产生 重要 影响 。 

与 我 们 曾经 学 习 的 数学 .物理 或 其 他 专业 技能 相 比 ,关于 互动 行为 的 思维 方式 是 显著 
不 同 的 。 

举例 来 说 ,你 将 要 参加 某 个 电视 台 的 记 歌 词 娱乐 节目 。 如 果 节 目 组 采取 个 体 选 拔 机 
制 ,那么 只 要 你 足够 努力 ,经 历 足够 时 长 的 训练 ,就 能 记 住 足够 多 的 歌词 ,顺利 实现 你 的 目 
标 。 但 是 ,如 果 电 视 台 要 求 5 人 组 团 参 加 ,情况 就 会 变 得 复杂 : 遇 到 一 个 不 努力 的 队友 该 
怎么 办 ? 队友 的 步调 与 自己 不 一 致 怎么 办 ? 此 时 已 不 单纯 是 个 人 努力 和 科学 决策 的 问题 
了 ,队友 之 间 的 相互 作用 将 不 再 单纯 受 某 一 个 人 的 意愿 控制 。 

又 如 在 篮球 比赛 中 ,并 不 是 付出 越 多 ,得 到 就 越 多 ,甚至 还 会 出 现 “ 南 辕 北 略 ” 的 现象 。 
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假如 你 使 用 "三 步 上 篮 ” 得 分 率 较 高 。 当 你 的 团队 得 分 较 低 时 ,你 可 能 有 些 急 切 ,倾向 于 频 
繁 地 使 用 "三 步 上 篮 ”。 也 许 很 快 你 就 会 发 现 , 你 使 用 "三 步 上 篮 ” 的 频率 越 高 ,对 手 对 你 的 
防守 也 越 强 ,于 你 反而 得 分 更 低 。 还 有 更 糟糕 的 ,你 控 球 的 时 间 越 长 ,次数 越 多 ,队友 越 抗 
拒 给 你 传 球 ! 

类 似 的 例子 在 生活 中 比比 皆 是 。 那 是 因为 ,人 的 行为 特别 是 互动 行为 使 一 个 人 的 决 
策 变 得 复杂 。 目 前 ,有 多 个 学 科 都 在 研究 人 的 行为 ,各 有 特色 、 互 有 联系 。 在 这 些 学 科 中 ， 
经 济 学 、 社 会 学 和 心理 学 是 三 个 相对 典型 的 学 科 。 经 济 学 一 般 从 个 人 动机 出 发 解释 人 类 
行为 所 带 来 的 社会 现象 ,是 从 微观 到 宏观 。 而 社会 学 大 多 从 规范 演进 的 角度 解释 个 人 的 
行为 ,是 从 宏观 到 微观 。 心 理学 则 是 考察 人 们 在 面 对 某 一 情景 时 的 行为 及 其 潜在 的 心理 
作用 机 制 。 前 两 者 的 研究 方法 是 逻辑 演绎 式 的 ,而 后 者 则 是 实验 归纳 式 的 。 此 外 ,新 近 发 展 
起 来 的 行为 科学 也 值得 一 提 。 它 是 一 个 边缘 学 科 , 涉 及 心理 学 、 社 会 学 、 人 类 学 、 政 治学 和 管 
理学 等 多 个 学 科 , 主 要 采用 实验 观察 方法 来 研究 不 同情 境 不 同人 群 的 行为 偏好 和 理论 实证 。 

本 书 将 要 介绍 的 博弈 论 , 同 样 也 是 研究 人 的 行为 。 但 是 ,与 社会 学 和 心理 学 等 学 科 不 
同 ,博弈 论 主 要 是 研究 具有 相互 作用 的 决策 主体 之 间 的 互动 行为 ,其 中 决策 主体 具有 理性 
思考 的 能 力 。 正 如 前 文 所 说 , 当 理性 的 决策 者 彼此 相互 作用 时 , 即 当 某 个 人 的 行动 依赖 于 
他 人 如 何 行动 的 时 候 , 关 于 “如 何 行动 有 何 结果 以 及 如 何 互动 * 的 讨论 就 会 变 得 非常 有 意 
思 , 也 会 引起 大 多 数 人 的 兴趣 。 虽 然 博弈 论 是 一 门 非 常年 轻 的 理论 ,在 起 源 上 属于 经 济 学 
范畴 ,但 是 其 应 用 却 十 分 广泛 ,跨越 多 个 学 科 。 博 弈 论 是 科学 与 艺术 的 完美 结合 ,其 力量 
也 恰恰 在 于 它 的 数理 精确 性 和 应 用 灵活 性 。 随 着 我 们 的 深入 介绍 ,这 一 点 将 会 慢 慢 浮 出 ， 
逐渐 清晰 。 

本 章 将 首先 通过 浅显 的 例子 使 你 对 博弈 论 建立 初步 印象 ,然后 介绍 基本 概念 ,接着 通 
过 经 典 案 例 来 加 深 理解 。 作 为 第 1 章 , 对 博弈 进行 简单 分 类 将 会 使 你 的 学 习 变 得 清晰 有 
序 。 最 后 ,本章 介 绍 了 博弈 论 的 历史 和 现状 ,以 期 你 对 常见 术语 和 重要 事件 形成 一 个 纵向 
的 脉络 。 


1.1 博弈 初 印象 


为 自己 获得 最 大 限度 的 幸福 ,是 任何 合乎 理性 的 行动 之 目的 。 
一 一 杰 里 米 。 边 沁 (Jeremy Bentham) 


1.1.1 博弈 是 一 种 游戏 


“博弈 ”中 的 “ 博 ”" 有 多 种 含义 ,如 “大 ”“ 广 ””“ 通 ”等 。 但 在 古文 中 ,“ 博 ”又 指 一 种 “局 
戏 ”, 即 “六 短 十 二 棋 ”, 而 “ 弈 ?的 本 意 即 指 * 围 棋 "”。 所 以 , 仅 从 字面 理解 ,博弈 ?是 一 种 游 
戏 。 实 际 上 人 博弈 论 " 一 词 是 从 英文 "game theory” 翻 译 而 来 的 ,本 意 就 是 “关于 游戏 的 理 
论 ”。“game” 一 词 非常 直观 地 概括 了 博弈 论 所 关注 的 内 容 , 如 游戏 场景 中 常见 的 策略 、 相 
互 作用 、 对 抗 与 合作 等 。 

关于 游戏 ,也 许 你 并 不 陌生 。“ 猜 硬币 “剪刀 石头 、 布 “围棋 ”以 及 各 类 纸牌 游戏 等 ， 
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都 是 大 家 从 小 就 接触 的 游戏 。 到 了 青少年 时 期 ,各 种 电子 游戏 更 是 令 人 人 流连忘返。 常见 
的 《英雄 联盟 ) 就 是 其 中 之 一 。 

在 《英雄 联盟 ) 中 ,“ 召 唤 师 峡谷 ”是 最 受 欢迎 的 地 图 。 游 戏 有 甲 , 乙 双 方 各 5 个 玩家 。 
甲乙 双方 都 选择 英雄 进行 相互 对 抗 ,并 以 杀 死 对 方 的 英雄 、 中 立 的 野 怪 和 推翻 防御 塔 等 
方式 来 获得 经 验 或 金币 。 所 以 ,双方 都 要 先 使 自己 的 英雄 强大 ,才能 实现 最 终 的 目标 , 摧 
毁 对 方 队伍 的 主要 基地 “水 晶 枢 纽 ”。 

纳什 男 珊 又 称 " 大 龙 ”, 是 中 立 的 野 怪 ,图 1-1 所 示 为 (英雄 联盟 ) 中 的 大 龙 。 双 方 都 想 
杀 掉 它 , 因 为 这 么 做 可 以 为 整个 团队 获得 额外 奖励 。 
所 以 在 大 龙 附近 常 有 冲突 游戏 双方 往往 为 了 争 
夺 大 龙 而 展开 团 战 。 当 然 , 攻 击 大 龙 也 会 遭 到 反击 ， 
从 而 损耗 英雄 的 生命 值 。 在 历经 多 次 较量 后 ,双方 
进入 这 样 一 个 局 面 : 甲 方 5 个 英雄 的 装备 和 等 级 略 
强 于 乙方 的 , 意 即 甲 方 的 战斗 力 略 胜 一 筹 。 目 前 双 
方 都 在 大 龙 附近 徘徊 , 团 战 一 触 即 发 。 关 于 是 否 进 
攻 大 龙 , 甲 、 乙 双方 都 有 两 种 可 能 选择 : 立即 进攻 ， 
或 等 待 对 方 先 行 以 便 坐 收 渔 利 。 各 方 应 该 如 何 行动 
呢 ? 让 我 们 分 4 种 情况 来 讨论 。 

(1) 甲乙 双方 都 等 待 。 此 时 双方 都 不 进攻 大 龙 , 也 不 会 杀 掉 大 龙 得 到 奖励 ; 显然 ， 
双方 无 得 无 失 ,不 妨 视 作 得 益 均 为 0。 

(2) 双方 同时 进攻 大 龙 。 此 时 甲乙 双方 可 能 发 生 对 战 ,同时 大 龙 也 会 还 击 。 鉴 于 甲 
方略 胜 一 筹 ,所 以 甲 方 更 容易 在 双方 对 抗 中 取得 胜利 。 尽 管 如 此 ,乙方 仍 有 机 会 获胜 。 假 
设 甲 、 乙 双方 获胜 的 可 能 性 分 别 为 70% 和 30% ,各 自得 益 不 妨 记 作 70 和 30 。 

(3) 甲 方 选择 等 待 , 乙 方 选 择 进 攻 。 考 虑 到 乙方 战斗 力 略 逊 于 甲 方 , 甲 方 又 以 逸 待 
劳 , 因 此 乙方 获胜 的 可 能 性 很 小 。 同 样 ,利用 获胜 可 能 性 来 表示 双方 得 益 , 甲 乙 分 别 对 应 
为 90 和 10。 

(4) 乙方 选择 等 待 , 甲 方 选择 攻击 。 虽 说 乙方 战斗 力 不 如 甲 方 ,但 是 能 够 伺机 而 动 
待 到 甲 方 虚弱 时 出 战 。 这 样 双方 势均力敌 ,成 功 的 概率 不 相 上 下 ,不妨 将 得 益 表 示 为 50 
和 50。 

也 许 你 对 双方 如 何 行动 仍然 没有 清晰 的 思路 。 就 游戏 的 任 一 方 而 言 , 自 己 的 行动 , 连 
同 对 方 的 行动 一 起 ,将 使 得 双方 陷入 4 种 不 同 的 境地 。 为 便于 比较 ,可 将 4 种 境地 以 及 双 
方 的 行动 对 应 ,组 成 矩阵 的 形式 ,如 图 1-2 所 示 。 和 矩阵 中 的 得 益 组 合 分 别 对 应 于 甲 方 和 乙 
方 的 得 益 。 

如 何 选择 才能 使 自己 处 于 最 佳 状 况 呢 ? 意 即 对 于 双方 而 言 如 何 行动 才能 使 各 自 的 得 
益 最 大 化 ? 


图 1-1 《英雄 联盟 ) 中 的 大 龙 


@ 尽管 也 有 书籍 称 之 为 “支付 "或 “收益 ”, 但 是 本 书 采用 了 更 具 一 般 性 的 说 法 ,统称 为 “得 益 ”。 实 际 上 ,三 者 都 
是 由 payoff 翻译 而 来 的 。 


乙方 
进攻 等 待 
进攻 | 70, 30 | 50, 50 | 
甲 方 
等 竺 90, 10 0, 0 


图 1-2 《英雄 联盟 一 一 攻击 大 龙 ) 双 方 的 得 益 矩 阵 


既然 所 考察 的 是 互动 行为 , 甲 方 需要 考虑 乙方 的 行动 。 那 么 甲 在 做 出 行动 之 前 必须 
思考 : 如 果 乙 方 进攻 ,我 该 怎么 做 才 是 最 好 的 。 所 谓 最 好 ,也 就 是 得 益 最 优 。 从 图 1-2 中 
可 以 看 出 , 若 给 定 乙 方 进攻 , 甲 方 在 进攻 和 等 待 之 间 抉 择 。 如 果 进 攻 则 得 益 为 70, 如 果 等 
待 则 为 90。 显 然 ,“ 如 果 乙 进攻 , 则 等 待 ”" 是 甲 的 理性 选择 。 同 理 , 如 果 乙 等 待 , 则 甲 进攻 
和 等 待 时 的 得 益 分 别 为 50 和 0。 因 此 “如果 乙 等 待 , 则 进攻 ”。 

进一步 ,“ 如 果 乙 进攻 , 则 等 待 ; 反之 则 进攻 "是 甲 针 对 乙 而 做 出 的 一 个 行动 计划 , 称 
之 “策略 ”。 对 于 每 个 参与 者 而 言 ,策略 常常 不 止 一 个 。 例 如 ,如 果 乙 进攻 , 则 进攻 ,反之 
则 等 待 ? 也 是 甲 的 一 个 策略 。 而 甲 的 决策 就 是 通过 比较 得 益 的 大 小 而 对 采取 何 种 策略 做 
出 选择 的 过 程 。 当 然 , 乙 也 能 推 知 甲 的 选择 ; 甲 也 知道 乙 知道 自己 的 选择 ; 以 此 递 进 , 乙 
也 知道 甲 知 道 乙 知 道 甲 的 选择 …… 

那么 , 乙 应 该 如 何 行动 呢 ? 首 先 , 乙 可 以 根据 甲 的 推理 进行 选择 , 即 “ 甲 知道 乙 , 乙 知 
道 甲 知道 乙 ”。 显 然 , 这 样 很 容易 使 双方 陷入 一 种 无 限 循环 。 其 次 ,与 其 一 环 套 一 环 的 思 
考 ,不 如 像 甲 一 样 直 接应 对 。 如 果 甲 进攻 , 乙 选 择 进攻 和 等 待 时 的 得 益 分 别 为 30 和 50。 
因此 ,“ 如 果 甲 进攻 , 则 等 待 "是 乙 的 理性 选择 。 同 理 ,“ 如 果 甲 等 待 , 则 进攻 ”也 是 乙 的 理性 
选择 。 与 甲 类 同 ,“ 如 果 甲 进攻 , 则 等 待 ; 反之 则 进攻 ?是 乙 的 一 个 策略 。 当 然 , 乙 的 策略 
也 有 多 个 。 

只 要 甲乙 双方 是 足够 理性 的 ,就 能 够 明确 自己 的 选择 ,同时 也 知道 对 方 的 选择 。 那 
么 ,( 甲 进攻 , 乙 等 待 ) 和 ( 甲 等 待 , 乙 进攻 ) 是 双方 的 共识 。 假 定 游戏 可 重复 ,双方 团队 处 于 
( 甲 进 攻 , 乙 等 待 ) 的 境地 。 那 么 , 甲 有 动机 单方 面 偏离 吗 ? 亦 即 在 给 定 对 方 行动 (等 待 ) 的 
条 件 下 甲 转 而 “等待”” 显然 没有 ,因为 那样 将 会 使 他 的 得 益 从 50 降 到 0。 同 样 地 ,假定 
甲 不 改变 行动 , 乙 也 没有 动机 单方 面 偏离 。 双 方 将 在 此 处 达到 相对 稳定 的 状态 , 谁 都 没有 
动机 偏离 一 一 这 就 是 均衡 ! 同 理 ,( 甲 等 待 , 乙 进攻 ) 也 是 一 个 均衡 。 

至 此 ,也 许 你 已 经 对 博 计 有 了 简单 的 了 解 。 所 谓 博 弈 ,就 是 一 些 个 人 或 组 织 在 一 定 的 
环境 和 规则 下 ,同时 或 先后 ,一 次 或 多 次 ,从 各 自 允 许 选择 的 行动 或 策略 中 进行 选择 并 加 
以 实施 ,各 自 取得 相应 结果 的 过 程 。 而 博弈 论 则 是 研究 博弈 中 决策 主体 之 间 相 互 作用 的 
理论 。 

那么 ,对 于 大 量 的 博弈 场景 ,应 该 如 何 定义 均衡 才 具 有 普 适 性 ? 有 多 个 均衡 时 又 该 如 
何 行动 ? 双方 对 均衡 的 理解 和 预测 不 一 致 时 该 怎么 办 ? 如 果 有 一 方 的 信息 是 隐蔽 的 ,此 
时 又 该 如 何 推断 双方 的 行动 ? 凡 此 种 种 ,还 有 许多 问题 有 待 深 入 阐述 。 本 书 将 在 第 2 一 5 
章 中 逐 层 递 进 、 由 浅 入 深 地 展开 讨论 。 
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LE 扩展 阅读 : 经 济 均衡 


平衡 现象 概念 和 分 析 方 法 ,常见 于 自然 科学 ,尤其 是 传统 的 力学 领域 。 而 经 济 学 在 
研究 人 们 的 经 济 行为 和 结果 时 借鉴 与 引入 了 平衡 分 析 法 。 

在 魁 奈 的 时 代 (Francois Quesnay,1694 一 1774) ,有 的 经 济 学 家 已 经 觉察 到 经 济 现象 
之 间 的 相互 依存 关系 ,这 些 复杂 的 相互 关系 时 常 处 于 一 种 相对 稳定 的 状态 。 但 是 他 们 谁 
也 没有 达到 足够 的 水 平 ,把 这 种 相互 依存 的 关系 清楚 明白 地 进行 理论 阐述 ,更 没有 能 力 认 
识 和 解释 这 种 稳定 状况 的 存在 条 件 , 以 及 打破 这 种 稳定 之 后 如 何 恢复 。 直 至 魁 奈 提出 了 
他 的 经 济 表 。 西 方 著 名 经 济 学 家 约瑟夫 。 阿 洛 伊 斯 能 彼 特 (Joseph Alois Schumpeter) 
曾 说 : 魁 奈 的 经 济 表 “ 是 最 先 设计 出 来 ,用 以 表达 明确 的 经 济 均 衡 概念 的 一 种 方法 "?。 及 
至 近代 ,英国 经 济 学 家 马 软 尔 把 均衡 概念 引入 经 济 学 的 理论 框架 ,创立 了 局 部 均衡 分 析 方 
法 。 法 国 经 济 学 家 瓦尔 拉 斯 把 均衡 分 析 应 用 到 更 广泛 的 分 析 领 域 ,创立 了 一 般 均衡 分 析 
方法 。 

在 不 同市 场 类 型 中 ,各 经 济 主体 经 济 行为 的 均衡 状态 均衡 条 件 以 及 由 此 推导 出 的 理 
论 和 原则 ,构成 了 现代 微观 经 济 学 的 重要 组 成 部 分 。 由 此 所 形成 的 均衡 分 析 方 法 不 仅 发 
展 成 为 经 济 分 析 的 基本 方法 ,也 为 分 析 非 平衡 问题 提供 了 一 个 基准 点 和 参照 系 。 至 今 , 均 
衡 理 念 和 均衡 分 析 几 乎 已 渗入 经 济 学 说 的 每 一 个 部 分 ,成 为 不 可 或 缺 的 经 济 分 析 方法 和 
经 济 理论 内 容 。 

实际 上 ,博弈 论 的 内 容 十 分 丰富 ,应 用 也 十 分 广泛 ,并 不 局 限于 上 述 思 路 。 但 是 发 展 
至 今 ,大 量 有 意义 的 结果 不 得 不 借助 于 专业 术语 和 数学 演绎 。 鉴 于 此 ,本 书 尝试 将 深奥 的 
理论 浅 易 化 ,并 辅 以 生动 的 案例 。 无 论 如 何 , 目 的 只 有 一 个 ,希望 博弈 论 能 够 给 你 的 学 习 
生活 带 来 些许 增益 ,因为 一 一 博弈 就 在 你 身边 。 


1.1.2 博弈 就 在 你 身边 


二 引 语 故事 : 酒吧 问题 


在 美国 西部 新 墨西哥 州 的 一 个 小 镇 上 共 住 着 100 人 。 和 镇 上 有 个 爱 法 罗 酒 吧 。 每 个 周 
四 晚上 ,人 们 要 么 去 该 酒吧 ,要 么 待 在 家 里 。 但 是 ,酒吧 只 能 容纳 60 人 一 一 超过 60 人 就 
会 显得 拥挤 ,服务 质量 也 会 随 之 下 降 。 大 家 普遍 认为 酒吧 顾客 越 少 越 安静 、 服 务 质 量 也 
越 高 


到 


第 一 周 , 这 100 人 中 的 大 多 数 去 了 酒吧 ,导致 酒吧 人 满 为 患 。 他 们 没有 享受 到 应 有 的 
乐趣 ,抱怨 还 不 如 待 在 家 里 。 那 些 选择 在 家 的 人 反而 上 暗自 庆幸 。 

第 二 周 , 人 们 根据 经 验 判 断 顾客 将 会 非常 多 ,所 以 决定 待 在 家 里 。 结 果 呢 ?因为 多 数 
人 决定 待 在 家 里 ,所 以 只 有 少数 人 到 酒吧 ,享受 了 一 次 高 质量 的 服务 。 

第 三 周 ,有 了 上 次 的 教训 ,大 家 都 认为 这 周 应 该 去 ,可 转念 一 想 又 觉得 应 该 待 在 家 里 。 
结果 呢 , 大 多 数 人 都 认为 酒吧 人 多 而 选择 待 在 家 里 一 一 又 是 只 有 少数 人 享受 到 了 高 质量 
的 服务 。 
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自 此 以 后 ,这 些 居民 每 周 都 要 面临 一 个 问题 : 去 酒吧 ,还 是 待 在 家 里 ? 


这 个 故事 被 称 作 酒 吧 问 题 ,是 一 个 典型 的 少数 者 博弈 。 少 数 者 博弈 由 瑞士 弗 里 堡 大 
学 的 张波 成 教授 和 D. Challet 提出 ,描述 了 一 个 群体 动态 竞争 有 限 资 源 的 过 程 。 在 少数 
者 博弈 中 ,策略 没有 对 与 错 , 只 有 少数 与 多 数 。 换 言 之 ,只 有 行为 区 别 于 大 多 数 人 的 这 部 
分 少数 者 才能 获得 更 多 的 利益 。 

回 到 酒吧 问题 。 显 然 , 小 镇 居民 是 否 去 酒吧 的 动机 来 源 既 非 获 胜 的 成 就 感 ,也 不 是 直 
接 的 金钱 收入 ,而 是 去 酒吧 给 自己 带 来 的 幸福 感 。 无 论 是 金钱 收入 ,还 是 成 就 感 和 幸福 
感 , 都 可 统称 为 效用 。 对 于 去 酒吧 的 人 而 言 , 同 时 去 酒吧 的 人 数 越 少 ,这 个 人 的 效用 就 越 
高 ,反之 越 低 ; 如 果 超 过 60 人 ,还 不 如 待 在 家 里 。 无 论 如 何 , 人 们 选择 的 基本 原则 是 一 致 
的 , 即 若 预 测 人 数 少 于 60 就 去 酒吧 ,否则 就 不 去 。 然 而 ,他 们 却 使 用 着 不 同 的 策略 来 指导 
各 自 的 行动 。 例 如 ,有 些 人 利用 前 一 周 的 酒吧 人 数 做 推断 ,而 有 些 人 则 利用 前 两 周 的 。 从 
整体 来 看 ,人 们 的 选择 是 随机 无 序 的 。 但 是 随 着 时 间 的 延长 ,去 酒吧 的 人 数 会 逐渐 演化 到 
一 个 稳定 状态 , 即 在 酒吧 容量 60 人 左右 波动 。 

上 述 结论 已 经 被 计算 机 实验 所 证 实 。 开 始 , 不 同 的 行动 者 确实 根据 自己 的 归纳 来 行 
动 ,并 且 去 酒吧 的 人 数 没 有 一 个 固定 的 规律 ; 然而 ,经 过 一 段 时 间 以 后 ,去 酒吧 的 平均 人 
数 很 快 达到 60, 即 去 与 不 去 的 人 数 之 比 是 60 : 40。 尽 管 每 个 人 不 会 固定 地 属于 去 酒吧 或 
不 去 酒吧 的 人 群 ,但 这 个 系统 的 比例 是 基本 不 变 的 。 这 是 理论 预测 的 均衡 。 也 就 是 说 ,他 
们 会 自 组 织 地 形成 一 个 生态 稳定 系统 。 

但 是 ,真实 人 群 却 不 是 这 样 的 。 布 瑞 因 ， 阿 瑟 (W. Brian Arthur) 教 授 通 过 对 真实 人 群 
的 观察 研究 ,发 现 人 们 的 预测 呈 有 规律 的 波浪 形态 。 实 验 中 去 酒吧 的 人 数 如 表 1-1 所 示 。 

表 1-1 酒吧 问题 对 真实 人 群 的 实验 数据 


虽然 不 同 的 参与 者 采取 了 不 同 的 策略 ,但 却 有 一 个 共同 点 : 这 些 预 测 都 是 用 归纳 法 
进行 的 , 亦 即 根据 历史 观察 来 行动 。 正 如 我 们 即将 看 到 的 那样 ,传统 经 济 学 认为 经 济 主体 
的 行动 是 建立 在 演绎 推理 之 上 的 ,但 阿 瑟 教授 却 给 出 反 证 ,指出 多 数 人 的 行动 是 基于 归 
纳 的 ! 

也 许 有 些 读者 会 认为 这 只 是 经 济 学 家 们 的 纸 上 游 戏 。 实际 上 并 非 如 此 , 它 已 经 深入 
人 们 的 生活 。 仔 细 观 察 ,你 就 会 在 身边 发 现 诸多 类 似 场 景 。“ 股 票 交易 “交通 拥挤 ”以 及 
“足球 博彩 ”等 问题 都 是 这 个 博弈 的 延伸 。 例 如 ,在 股票 市 场 上 ,如果 多 数 股 民 做 空 ( 卖 出 ) 
一 只 股票 ,那么 股价 就 会 走低 。 但 是 你 若 反 其 道 而 行 , 则 更 有 可 能 获得 丰厚 利润 。“ 少 数 
者 博弈 ”还 可 以 在 择 校 择业 中 找到 印证 。 在 高 考 填报 志愿 时 ,每 个 人 都 会 根据 往年 的 录取 
分 数 线 进行 判断 ,来 选择 报考 院 校 。 然 而 ,总 会 出 现 有 些 学 校 “热门 专业 分 数 不 高 ,冷门 专 
业 分 数 不 低 ”的 现象 。 这 并 不 难 理解 ,往年 的 热门 学 校 和 专业 必然 是 当年 很 多 人 的 首选 ， 
这 样 一 来 ,很 多 人 为 了 避免 激烈 的 竞争 从 而 选择 报考 相对 冷门 的 专业 和 学 校 , 怀 有 这 种 想 
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法 的 人 多 了 ,原来 冷门 的 院 校 也 就 变 成 热门 的 了 。 相 反 , 有 些 大 胆 填报 热门 院 校 的 人 却 可 
能 因此 而 顺利 进入 热门 院 校 。 

如 何 理解 现实 生活 中 这 些 令 人 困惑 的 现象 ? 为 什么 理论 与 实际 会 有 如 此 大 的 差异 ? 
这 些 行为 的 互动 机 制 是 怎样 形成 的 ? 诸如 这 类 问题 ,你 将 在 本 书 第 6 一 7 章 的 重复 博弈 和 
演化 博弈 中 找到 答案 。 

在 第 6 章 之 前 ,我 们 主要 讨论 参与 者 如 何 * 向 前 展望 , 倒 后 推理 ”。 无 论 是 将 要 学 习 的 
完全 信息 静态 博弈 和 动态 博弈 ,还 是 不 完全 信息 博弈 ,都 要 求 参与 主体 是 完全 理性 的 , 即 
在 向 前 展望 和 倒 后 推理 中 对 均衡 的 预测 足够 准确 .足够 一 致 。 这 部 分 内 容 的 突出 特征 是 
从 普遍 的 和 基本 的 假设 出 发 , 抓 住 主体 间 的 利益 冲突 和 行为 互动 这 一 关键 ,提出 了 由 参与 
者 .策略 集 、 信 息 集 及 得 益 函 数 等 要 素 构成 的 统一 研究 范式 。 这 种 研究 方法 适合 于 一 切 涉 
及 竞争 和 选择 的 互动 行为 。 然 而 ,社会 实际 更 多 的 是 偏离 均衡 的 和 时 间 动 态 的 ,而 且 行为 
主体 的 完全 理性 假设 只 是 一 种 理想 状态 。 因 此 ,博弈 论 的 发 展 也 并 非 一 帆 风 顺 ,始终 伴随 
着 质疑 和 挑战 。 

正当 关于 均衡 的 深入 研究 前 途 迷 茫 并 且 进 展 缓慢 的 时 候 , 大 量 的 研究 却 转向 了 参与 
者 如 何 进行 博弈 、 他 们 如 何 从 历史 中 不 断 学 习 , 以 及 如 何 通 向 更 高 层次 的 合作 行为 等 。 从 
生物 学 当中 借鉴 来 的 进化 思维 方式 也 显示 出 意义 非凡 的 特性 ,这 些 特 性 对 于 研究 个 人 或 
组 织 的 行为 演变 大 有 神 益 。 而 且 , 随 着 博弈 论 基 础 建构 的 完成 ,研究 者 们 的 研究 内 容 也 由 
竞争 性 互动 逐步 向 更 广 的 社会 信念 拓展 ,诸如 合作 公平, 利 他 等 。 一 般 来 讲 , 合 作 就 是 个 
人 与 个 人 ,群体 与 群体 之 间 为 达到 共同 目的 ,而 彼此 相互 配合 的 一 种 联合 行动 。 而 竞争 则 
是 个 体 或 群体 间 力图 胜 过 或 压倒 对 方 的 行动 或 心理 需要 。 竞 争 的 产生 可 从 人 的 自私 性 来 
理解 ,而 合作 是 如 何 产生 的 ? 这 正 是 第 6 章 及 以 后 所 要 关注 的 内 容 。 可 见 除了 竞争 外 , 博 
弈 中 还 有 更 丰富 的 内 容 。 


1.1.3 博弈 不 只 有 竞争 


二 引 语 故 事 :“ 人 金 球 "节目 中 的 奖金 分 配 


BBC( 英 国 广播 公司 ) 电 视 制作 中 心 曾 于 2007 年 6 月 至 2009 年 12 月 制作 过 280 多 
集 娱乐 节目 ,名 叫 “ 金 球 ”(Golden Balls)。 在 每 集 节 目 中 都 有 多 名 选手 进行 角逐 ,到 最 后 
只 剩 下 2 名 选手 和 一 大 笔 奖 金 。 奖 金 从 一 点 点 到 17. 5 万 英镑 不 等 , 视 前 几 轮 的 角逐 情况 
而 定 。 这 时 ,主持 人 会 给 每 人 2 个 球 , 其 中 一 个 写 着 “平分 ”(split), 另 一 个 写 着 " 偷 走 ” 
(steal) 。 两 个 参赛 者 需要 从 中 选择 1 个 球 。 现 假设 奖金 为 10 万 英镑 ,两 个 人 的 行动 会 呈 
现 如 下 三 种 局 面 。 

(1) 如 果 两 个 人 都 选择 了 “平分 ”, 那 么 辟 大 欢喜 ,两 个 人 可 以 平分 之 前 累积 的 奖金 。 
这 是 最 理想 的 情况 。 在 这 种 情况 下 两 个 人 各 自得 到 了 5 万 英镑 。 

(2) 如 果 其 中 一 人 选择 "平分 ”, 而 另 一 人 选择 " 偷 走 ”, 那 么 选择 "平分 "的 人 不 但 一 分 
未 得 ,还 会 产生 “被 偷 ” 的 负面 情绪 。 不 妨 假设 他 的 得 益 为 1, 其 中 1 是 小 于 0 的 常数 。 同 
时 ,选择 “ 偷 走 ” 的 人 可 以 拿 到 全 部 的 10 万 英镑 。 
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(3) 如 果 两 个 人 都 选择 了 “ 偷 走 ”, 那 么 两 个 人 一 分 钱 也 得 不 到 。 
想象 一 下 ,如 果 你 作为 参赛 选手 进行 到 最 后 一 轮 , 此 时 你 将 做 何 选择 ? 


与 游戏 (英雄 联盟 ?中 的 做 法 类 似 , 我 们 将 上 述 三 种 情况 下 的 得 益 写 成 矩阵 的 形式 ,如 
图 1-3 所 示 ,其 中 得 益 组 合 中 逗号 前 对 应 于 选手 1 的 得 益 。 


平分 偷 走 
平分 (5, 5) (1 10) 
选手 1 
丛 走 | (10, 7) (0, 0) 


图 1-3 “ 金 球 ” 节 日 中 选手 的 行动 (1/0) 


当选 手 1 进行 选择 时 ,需要 考虑 选手 2 的 选择 。 假 定 选手 2 选择 “平分 ”, 那 么 选手 1 
在 “平分 得 5” 和 “ 偷 走 得 10” 之 间 比 较 , 显 然 选择 “ 偷 走 ” 是 最 佳 的 。 假 定 选 手 2 选择 “ 偷 
走 ”, 则 选手 1 需要 在 “平分 得 :" 和 “ 偷 走 得 0” 之 间 比 较 , 仍 然 是 选择 “ 偷 走 ” 为 最 佳 。 可 
见 ,无 论 对 手 如 何 选择 ,选手 1 选择 “ 偷 走 ” 都 是 一 个 上 策 。 同 理 , 选 手 2 不 仅 认识 到 选手 
1 的 选择 ,而 且 还 认识 到 他 自己 的 上 策 同样 是 “ 偷 走 ”。 

那么 ,选手 1 和 选手 2 都 将 选择 “ 偷 走 ”。 即 便 有 人 出 错 , 在 " 吃 一 租 ,长 一 智之 后 仍 
将 “性 然 悔悟 ?>。 因 此 ”1 选择 偷 走 ,2 选择 偷 走 ” 是 双方 都 愿意 的 局 面 ,是 该 博弈 的 一 个 均 
衡 。 在 此 情境 下 ,没有 任何 一 方 有 动机 单方 面 偏离 , 意 即 对 方 的 行动 不 变 , 自 己 从 “ 偷 走 ” 
改 成 “平分 ”。 换 言 之 ,尽管 二 者 都 知道 选择 “平分 "是 最 理想 的 局 面 ,但 是 在 追求 自身 利益 
最 优 时 却 陷入 了 都 “ 偷 走 ” 的 困境 。 这 就 是 “囚徒 困境 ”, 博 弈 论 中 的 经 典 场 景 之 一 。 

一 般 来 讲 ， 囚 徒 困 境 ” 这 一 博弈 是 不 容许 "囚徒 ?也 就 是 参与 者 进行 信息 沟通 的 ,需要 
他 们 独立 做 出 各 自 的 选择 。 即 便 在 一 定 程 度 下 放松 这 种 要 求 ,仍然 没有 显著 改善 。 例 如 ， 
在 做 出 选择 之 前 两 个 人 可 以 互相 商量 。 于 是 在 这 个 节目 里 经 常 出 现 如 下 两 种 情况 。 

(1) 一 个 人 极力 保证 自己 一 定 会 选择 “平分 ”, 让 对 方 也 选择 “平分 ”, 这 样 两 个 人 可 以 
平分 奖金 一 一 但 最 后 这 人 却 改 成 了 “ 偷 走 ”。 

(2) 两 个 人 都 说 好 了 选 “ 平 分 ”一 一 最 后 都 暗自 换 成 了 “ 偷 走 ”。 

注意 ,上 文 使 用 了 “经常” 一 词 。 这 会 不 会 仅仅 意味 着 一 种 主观 感知 ? 为 了 给 出 相对 
客观 的 结论 , 范 ， 德 ， 阿 西 姆 (Van den Assem) 等 (2012) 曾 对 287 集中 的 574 名 选手 样 
本 进行 了 统计 ,发 现 两 者 平分 奖金 的 人 数 占 比 31% .1 人 平分 1 人 偷 走 的 比例 是 44% ,而 
两 个 人 都 偷 走 的 比例 是 25%。“ 金 球 ” 节 目 中 选手 的 选择 分 布 如 图 1-4 所 示 。 同 时 ,还 有 
一 个 有 意思 的 现象 : 奖金 数额 小 时 合作 概率 较 高 ,奖金 数额 越 大 ,合作 的 倾向 越 低 。 


选手 2 
平分 偷 走 
平分 31% 22% 
选手 1 
偷 走 22% 25% 


图 1-4 “ 金 球 ? 节 目 中 选手 的 选择 分 布 
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在 整个 人 群 中 ,选择 合作 的 人 数 只 占 了 不 到 1/3, 更 多 的 人 在 利益 冲突 时 选择 了 非 合 
作 的 行动 。 也 许 这 正 是 你 所 理解 的 博弈 论 . 它 是 关于 对 抗 或 竞争 性 策略 的 理论 。 实 际 上 ， 
不 仅仅 是 博弈 论 ,包括 经 济 学 乃至 心理 学 等 都 在 一 定 程度 上 承认 人 是 自私 的 ,到 处 可 见 
“自私 的 基因 ”。 

《自私 的 基因 ;一 书 的 作者 克林顿 。 理 查 德 。 道 金 斯 (Clinton Richard Dawkins) 曾 被 
一 家 世界 上 最 大 的 计算 机 公司 请 去 ,组 织 他们 的 高 管 进 行 一 个 为 期 一 整 天 的 策略 游戏 , 目 
的 是 让 他 们 一 起 友善 地 合作 。 高 管 们 被 分 成 红 、 蓝 、 绿 三 组 ,游戏 和 上 述 的 “囚徒 困境 ” 差 
不 多 。 不 幸 的 是 ,这 个 公司 想 达 到 的 合作 目标 并 没有 实现 。 就 像 上 述 结果 一 样 , 虽 然 宣 布 
游戏 在 下 午 4 点 结束 ,但 红 方 和 绿 方 在 游戏 开始 后 很 快 就 陷入 一 连 串 的 背叛 之 中 。 在 事 
后 的 讨论 会 上 ,大 家 都 对 合作 愿景 的 破碎 感到 十 分 愧 恼 。 

可 见 , 并 非 只 有 少数 人 才 具 有 合作 意愿 ,但 是 合作 行为 却 并 非 那么 普遍 。 怎 样 才 能 在 
没有 强力 约束 的 条 件 下 自愿 达成 合作 呢 ? 这 个 问题 已 经 并 仍 将 困惑 人 们 很 久 。 

在 第 一 次 世界 大 战 期 间 ,西部 前 线 展 现 了 一 幅 为 几 尺 领土 而 浴血 战斗 的 残酷 画面 。 
但 是 在 这 些 战斗 的 空隙 中 ,敌对 的 士兵 却 经 常 表现 出 很 大 的 克制 。 一 位 巡视 前 方 战壕 的 
英 军 参谋 官员 写 道 : 

[我 ] 惊 奇 地 发 现 对 方 德军 士兵 在 来 复 枪 射 程 以 内 走动 着 。 我 们 的 人 却 不 予 理 上 星 ， 我 
上 暗自 下 决心 , 当 我 们 接管 这 里 时 一 定 要 杜绝 这 类 事情 。 这 种 事情 是 绝对 不 允许 的 ,这 些 人 
明显 不 懂 这 是 战争 。 双 方 显然 相信 “自己 活 也 让 别人 活 ” 的 策略 。 

这 不 是 一 个 孤立 的 例子 “自己 活 也 让 别人 活 ” 的 系统 是 琵 壕 战 的 特产 。 尽 管 高 级 军 
官 想 尽 力 阻 止 它 ,尽管 有 战斗 激 起 的 义愤 和 杀人 或 者 被 杀 的 军事 逻辑 ,尽管 上 级 的 命令 能 
够 轻易 制止 任何 下 属 试图 直接 停战 的 努力 ,但 是 这 个 系统 仍然 在 相当 长 的 历史 时 期 内 存 
在 着 。 

继续 深入 探究 ,在 每 个 人 都 有 竞争 动机 的 情况 下 怎样 才能 产生 合作 呢 ? 合作 是 怎样 
维持 下 去 的 ? 为 什么 在 合作 中 又 会 不 断 地 出 现 背叛 行为 ? 对 这 些 问 题 的 回答 ,不 仅 涉及 
无 限 重 复 博弈 的 概念 ,还 关系 到 决策 主体 偏好 的 演化 ,以 及 合作 博弈 的 知识 。 这 些 内 容 将 
在 第 8 章 中 进行 讨论 ,同时 第 6 一 7 章 也 会 有 所 涉及 。 

总 之 ,我 们 希望 读者 通过 博弈 论 学 习 , 理 解 并 掌握 一 些 人 际 互动 中 的 思维 方式 。 虽 然 
人 际 互动 中 并 非 处 处 是 理性 的 ,但 是 了 解 和 掌握 这 些 思维 方式 将 比 单纯 的 知识 学 习 更 
重要 。 

(1) 策略 思维 。 策 略 思维 要 求 你 尽 可 能 周全 地 列 出 未 来 可 能 发 生 的 状况 ,然后 根据 
这 些 状况 制订 相应 的 行动 计划 , 亦 即 如 果 出 现 某 种 状况 ,你 将 如 何 应 对 。 当 然 , 现 实 中 常 
见 的 是 多 步行 动 , 因 此 要 求 你 看 得 尽量 远 , 对 可 能 状况 考虑 得 足够 完备 。 一 般 而 言 ,行动 
越 靠 后 ,预测 越 困 难 。 因 此 ,策略 思维 的 训练 将 真正 考验 你 的 “远见 ”。 同 时 ,你 还 要 形成 
非常 清晰 的 动机 (抑或 利益 关切 ) 。 只 有 如 此 ,才能 找到 最 佳 的 策略 ,非常 明确 地 移 步 向 
前 ,而 不 至 因 小 失 大 ,更 不 至 于 漫 无 目的 。 

(2) 换 位 思考 。 由 于 是 互动 行为 ,所 以 你 需要 从 对 方 的 角度 思考 问题 ,才能 预先 判断 
对 方 的 可 能 行动 。 而 这 一 点 也 是 策略 思维 所 必需 的 。 不 过 .从 别人 的 角度 思考 问题 说 来 
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容易 ,能 够 真正 做 到 却 并 非 易 事 。 人 们 总 喜欢 把 别人 看 作 另 一 个 自己 ,而 不 是 完全 不 同 的 
行为 个 体 。 因 此 ,“ 设 身 处 地 "要求 人们 从 “已 所 不 欲 , 勿 施 于 人 ”逐渐 转变 为 * 人 所 不 欲 , 勿 
施 于 人 ”。 博弈 论 能 够 提供 一 些 概 念 和 工具 ,让 你 尝试 分 析 自 己 若 处 于 对 方 的 境地 ,思路 
会 有 什么 变化 一 一 哪怕 你 完全 不 能 同意 他 们 的 见解 。 

(3) 道 向 归纳 。 首 向 归纳 要 求人 们 “着 眼 未 来 ,立足 当下 ”。 当 你 建立 策略 思维 的 时 
候 , 也 许 更 加 看 重 整 体 的 长 远 的 目标 ,反而 忽视 了 当下 的 行动 。 道 向 归纳 却 告 诉 人 们 , 当 
你 对 眼前 的 一 团 乱 局 无 所 适 从 时 ,不 妨 从 你 的 长 远 目标 或 期 望 结局 出 发 ,逐步 向 前 分 析 ， 
倒 推 至 当下 , 找 出 现在 应 该 走 哪 条 路 ,从 哪里 着 手 。 然 后 再 步步为营 ,逐渐 接近 期 望 目标 。 
只 有 这 样 ,才能 避免 成 为 别人 眼中 的 “ 志 大 才 朴 ”。 后 文 一 再 提 及 的 “向 前 展望 , 倒 后 推 
理 ”, 即 是 逆向 归纳 的 形象 化 表述 。 

本 书 收集 梳理 了 丰富 而 精彩 的 案例 与 博弈 情景 ,力求 通过 通俗 易 懂 的 阐释 为 你 呈现 
博弈 的 方法 论 ,但 我 们 不 会 提供 一 份 菜单 式 答案 。 也 就 是 说 , 当面 对 一 个 特殊 的 博弈 情景 
时 ,为 了 获取 正确 的 答案 ,你 需要 将 它 的 (信息 和 其 他 别 的 ) 特 征 进行 梳理 、 综 合 , 进 而 寻求 
合适 的 博弈 知识 来 展开 分 析 。 你 从 本 书 学 到 的 将 是 综合 这 些 特征 的 系统 方法 ,而 非 攻 略 
或 答案 ; 此 外 ,本 书 还 将 介绍 一 些 展开 分 析 的 基本 理论 和 实用 工具 。 


1.2 博弈 的 概念 


对 任何 一 个 博弈 或 冲突 局 势 的 分 析 都 必须 从 描述 该 博弈 的 特征 出 发 。 而 利用 模型 对 
一 个 博弈 的 特征 进行 刻画 ,能 够 快速 抓 住 问题 的 本 质 。 因 此 ,我们 需要 了 解 用 来 描述 博弈 
的 一 般 形 式 或 结构 ,并 将 之 作为 博弈 建 模 的 重点 。 当 然 , 过 于 简单 或 复杂 都 不 利于 我 们 对 
博弈 展开 分 析 。 而 常见 的 ` 也 是 重要 的 两 种 博弈 表示 方式 为 策略 式 和 扩展 式 。 前 者 相对 
简单 和 基础 ,后 者 可 以 理解 为 是 对 前 者 未 尽 描述 的 扩展 ,主要 体现 在 博弈 规则 方面 的 
刻画 。 


1.2.1 博弈 的 要 素 


上 一 节 介绍 了 3 个 博弈 ,分 别 是 (英雄 联盟 ) 中 的 团 战 .酒吧 问题 和 “人 金 球 ” 节 目 中 的 奖 
金 分 配 。 在 这 3 个 博弈 中 ,有 些 组 成 部 分 是 每 个 博弈 都 有 的 ,是 必 不 可 少 的 。 推 而 广 之 ， 
任何 一 个 博弈 都 需要 具备 以 下 3 个 要 素 。 

(1) 博弈 的 参与 者 。 

(2) 每 一 个 参与 者 可 供 选 择 的 策略 。 

(3) 每 一 个 可 能 策略 所 对 应 的 参与 者 得 益 。 

具备 上 述 3 个 要 素 的 博弈 称 为 策略 式 博弈 。 策 略 式 博弈 是 最 基础 的 一 类 博弈 ,也 是 
博弈 论 最 早 研 究 的 一 类 ,因此 也 可 称 为 标准 式 博弈 。 除 此 之 外 ,还 有 一 类 博 穿 也 非常 普 
遍 , 被 称 作 扩展 式 博弈 。 一 个 扩展 式 博 穿 包括 以 下 信息 。 

(1) 博弈 的 参与 者 。 

(2) 每 一 个 参与 者 可 供 选择 的 策略 。 
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(3) 每 一 个 可 能 策略 所 对 应 的 参与 者 得 益 。 

(4) 行动 的 次 序 , 即 参与 者 何 时 行动 。 

(5) 参与 者 行动 时 所 知道 的 信息 。 

(6) 所 有 随机 事件 的 概率 分 布 。 

实际 上 ,策略 式 博弈 并 没有 考虑 行动 的 时 序 \ 信 息 结构 和 参与 者 对 随机 事件 的 外 生 信 
念 等 事项 ,而 这 些 可 被 笼统 地 称 为 博弈 的 规则 。 而 扩展 式 博 弈 则 包含 所 有 行动 的 序列 与 
信息 的 全 面 描述 。 就 这 点 而 言 , 策 略 式 博弈 是 没有 考虑 博弈 规则 的 静态 博弈 ,而 扩展 式 博 
弈 则 可 视 为 动态 模型 。 如 果 时 间 对 所 考察 的 问题 而 言 无 足 轻重 ,那么 可 将 时 间 维 度 去 掉 ， 
从 而 简化 成 为 策略 式 博弈 。 从 最 小 覆盖 来 讲 ,策略 式 博弈 所 包含 的 要 素 是 构成 所 有 博弈 
所 必 备 的 要 件 。 之 所 以 说 它们 * 必 备 ”, 约 翰 。 汉 “， 诺 依 曼 (John von Neumann) 和 奥 斯 
卡 。 摩 根 斯 坦 (Oskar Morgenstern) 曾 经 有 如 下 的 论述 。 

博弈 研究 者 是 要 尽力 预测 理性 参与 者 在 给 定 博弈 的 每 一 个 可 能 阶段 应 该 做 什么 。 如 
果 知 道 了 博弈 的 结构 (博弈 的 要 素 ) ,我 们 应 该 可 以 在 博弈 实际 行动 开始 之 前 ,就 能 做 分 析 
和 预测 。 如 果 参 与 者 是 理性 的 ,他 们 也 会 做 同样 的 分 析 和 预测 ,并 在 博弈 开始 之 前 确定 其 
理性 的 行动 计划 (策略 )。 因 而 ,假定 所 有 参与 者 在 博弈 一 开始 就 同时 制定 了 他 们 的 策略 ， 
其 策略 应 该 是 不 失 一 般 性 的 。 于 是 ,实际 的 博弈 运转 只 是 实施 这 些 策略 并 按照 博弈 规则 
确定 结果 的 机 械 过 程 。 换 言 之 ,可 以 假定 所 有 参与 者 在 博弈 一 开始 就 同时 做 出 所 有 的 实 
质 性 决策 ,因为 每 个 参与 者 的 实质 性 决策 都 被 假设 为 对 一 个 完整 策略 的 选择 。 而 这 种 策 
略 选择 确定 了 在 博弈 的 任何 阶段 和 任何 可 能 情况 下 该 参与 者 所 要 做 的 行动 。 参 与 者 同时 
而 又 独立 地 做 出 各 自 策 略 决策 的 情形 ,恰好 就 是 博弈 的 策略 式 表述 。 

这 段 话 旨 在 说 明 3 个 要 素 对 于 描述 任 一 博弈 的 必要 性 。 尽 管 这 个 论证 的 必要 性 已 经 
显 出 局 限 ,但 是 它 的 充分 性 仍 是 博弈 论 中 最 重要 的 思想 之 一 。 现 在 ,让 我 们 详细 讲解 策略 
式 博 弈 的 3 个 要 素 。 至 于 扩展 式 博弈 的 要 素 ,后 文 将 逐步 介绍 。 

首先 ,博弈 的 参与 者 。 正 如 前 文 所 述 ,博弈 论 一 般 都 假设 参与 者 是 理性 的 。 如 果 一 个 
决策 者 在 追逐 其 目标 时 能 够 前 后 一 致 地 做 决策 我们 就 称 他 是 理性 的 。 更 通俗 一 些 讲 ,每 
一 个 理性 的 决策 者 所 采取 的 行为 都 是 力图 以 最 小 的 成 本 获得 自己 的 最 大 收益 。 我 们 假设 
每 个 参与 者 的 目标 都 是 追求 其 个 人 期 望 利益 的 最 大 化 ,而 利益 则 是 用 某 个 效用 函数 来 度 
量 的 。 冯 “。 诺 依 曼 和 摩根 斯 坦 曾 借助 于 非常 弱 的 假设 证 明了 下 述 结 果 : 对 任 一 理性 的 决 
策 者 ,一 定 存在 某 种 方式 对 他 所 关心 的 各 种 可 能 结果 赋予 效用 值 .使 其 总 是 选择 最 大 化 自 
己 的 期 望 效 用 。 进 一 步 ,理性 可 以 区 别 为 完全 理性 .有限 理 性 和 非 理性 。 完 全 理性 的 参与 
者 总 是 会 以 效用 最 大 化 的 方式 行动 ,总 是 能 够 考虑 所 有 的 可 能 方案 ,并 对 任意 复杂 的 过 程 
进行 推论 。 有 限 理 性 则 认为 参与 者 所 获得 的 信息 和 推理 能 力 都 是 有 限 的 ,所 能 够 考虑 的 
方案 也 是 有 限 的 ,未 必 能 做 出 使 得 效用 最 大 化 的 决策 。 而 非 理 性 则 是 完全 理性 的 对 立 面 ， 
参与 者 的 决策 毫 无 一 致 性 可 言 。 尽 管 非 理 性 也 有 很 多 意义 非常 的 现象 ,但 一 般 来 讲 , 博 弈 
论 主 要 关注 完全 理性 和 有 限 理性 的 假定 。 

“所 有 个 体 都 具有 完全 理性 ?是 一 个 非常 苛刻 的 假定 ,但 是 在 这 种 假定 下 所 得 出 的 结 
论 却 给 决策 者 提供 了 一 个 可 供 参照 的 理想 状态 。 这 种 理想 状态 也 可 以 用 进化 学 习 来 解 
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释 。 当 参与 者 由 于 缺乏 足够 理性 而 错过 了 最 优 决 策 时 ,那么 他 们 会 通过 不 断 学 习 而 彰 向 
完全 理性 的 结果 和 努力。 我 们 毫 无 理由 相信 他 们 会 朝 相 反 的 非 理性 方向 努力 一 尽管 非 理 
性 的 行为 并 不 会 从 此 消失 。 

此 外 ,还 可 以 根据 利益 对 象 将 理性 分 为 集体 理性 和 个 体 理性 。 所 谓 集 体 理性 ,就 是 
指 参与 者 的 行为 动机 是 为 了 追求 集体 利益 最 大 化 ,而 个 体 理性 则 是 为 了 追求 个 人 利益 
最 大 化 。 与 个 体 理性 下 的 独立 决策 不 同 ,集体 理性 下 的 决策 往往 需要 参与 者 之 间 形成 
有 约束 力 的 协议 ,以 协调 集体 利益 与 个 体 利益 之 间 的 冲 网 
突 , 这 一 区 别 与 完全 理性 和 有 限 理性 的 区 别 其 同 作用 , 影 CC Aim 
下 分 林 的 点 ,形成 相 分明 的 和 分 林 方法。 a ( 上 理性 


在 稍 后 的 博弈 分 类 中 还 将 谈 及 这 一 点 。 图 1-5 所 示 为 理性 天 性 对 龟 < 全 何必 
分 类 。 个 体 理 性 
其 次 ,每 一 个 参与 者 可 供 选择 的 策略 。 策 略 是 指 参与 国 9 渴 住 分 类 


者 针对 他 人 的 可 能 行动 和 不 同 的 外 在 状况 而 制订 的 行动 
计划 。 它 是 参与 者 行动 的 蓝图 ,告诉 参与 者 在 某 种 状况 下 应 该 如 何 行动 。 每 一 个 参与 者 
都 需要 至 少 一 个 策略 来 做 选择 。 一 个 参与 者 所 有 的 可 选 策略 称 为 这 个 参与 者 的 策略 集 。 
所 有 参与 者 都 选 定 自己 的 一 个 策略 时 ,所 有 这 些 策 略 所 组 成 的 匹配 称 作 一 个 策略 组 合 。 
例如 ,在 "人 金 球 ? 节 目的 奖金 分 配 博弈 中 , (平分 , 偷 走 ) 是 选手 1 的 策略 集合 ,而 "选手 1 平 
分 ,选手 2 平分 ? 则 是 该 博弈 的 一 个 策略 组 合 。 

在 策略 式 博弈 中 ,行动 与 策略 可 视 为 等 同 的 ,而 在 扩展 式 博 弈 中 策略 将 比 行动 拥有 更 
加 丰富 的 意义 。 这 一 点 在 以 后 的 章节 中 将 有 详细 介绍 。 对 于 某 一 给 定 的 参与 者 而 言 ,对 
策略 的 比较 依赖 于 其 他 人 的 策略 。 例 如 ,在 (英雄 联盟 游戏 中 ,己方 “进攻 ”和 “防守 ”并 没 
有 绝对 的 优 劣 , 而 是 取决 于 对 手 的 行动 。 但 是 ,在 某 些 情况 下 策略 是 可 以 比较 的 。 也 就 是 
说 ,不 管 其 他 人 如 何 选择 , 某 一 个 参与 者 的 某 一 策略 始终 优 于 另 一 个 策略 。 例 如 ,在 "人 金 
球 ” 节 目 中 ,选择 “ 偷 走 ” 对 于 两 个 选手 而 言 都 是 优 于 “平分 "的 。 此 外 ,可 供 选 择 的 策略 既 
可 以 是 有 限 多 种 ,也 可 以 是 无 限 多 种 , 视 具体 情况 而 定 。 

最 后 ,参与 者 的 得 益 或 者 支付 , 意 即 每 个 参与 者 通过 参与 博弈 得 到 或 失去 多 少 。 就 像 
前 面 所 提 到 的 ,每 个 参与 者 的 得 益 通过 他 的 效用 来 度量 。 所 谓 效用 ,确定 了 一 个 参与 者 选 
择 一 个 策略 时 的 对 应 得 益 。 由 于 其 他 参与 者 的 策略 也 会 影响 该 参与 者 的 得 益 , 因 此 任 一 
参与 者 的 效用 都 是 自己 策略 与 他 人 策略 所 构成 组 合 的 函数 。 

早期 经 济 学 家 认为 效用 如 同人 的 身高 和 体重 一 样 是 可 以 测量 的 。 例 如 ,在 “ 金 球 ” 节 
目 中 选手 的 效用 可 以 用 所 得 奖金 来 衡量 ,这 是 切实 的 货币 度量 。 而 现在 比较 通用 的 是 序 
数 效用 。 所 谓 序数 效用 ,是 指 效用 作为 一 种 心理 现象 无 法 计量 ,也 不 能 加 总 求 和 ,效用 之 
间 的 比较 只 能 通过 顺序 或 等 级 来 进行 。 例 如 ,上 节 中 小 镇 居民 去 酒吧 所 获得 的 幸福 感 是 
无 法 具体 度量 的 。 但 是 ,酒吧 人 数 为 90 与 为 40 时 的 幸福 感 显 然 是 不 同 的 、 可 比较 的 。 因 
此 , 当 酒 吧 人 数 为 90 时 ,去 酒吧 的 效用 到 底 是 哪个 具体 数值 并 不 重要 ,重要 的 是 它 要 比 人 
数 为 40 时 的 效用 小 。 由 此 出 发 ,一 个 效用 函数 并 非 用 来 指示 幸福 的 具体 值 ,而 是 比较 不 
同 状 态 之 间 的 大 小 关系 。 
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上 述 3 个 要 素 是 构成 一 个 博弈 的 基本 。 除 此 之 外 还 有 诸如 行动 次 序 、 信 息 结 构 和 概 
率 分 布 等 。 于 读者 而 言 ,行动 次 序 也 许 不 难 理解 ,信息 结构 可 能 稍 显 陌生 。 接 下 来 的 
1.2.2 节 将 详细 介绍 信息 结构 。 


2 扩展 与 阅读 : 边 沁 与 效用 


根据 微观 经 济 学 的 定义 ,效用 只 是 偏好 的 一 种 表现 。 也 就 是 说 ,偏好 不 具备 基数 效用 
的 性 质 , 而 是 表达 一 种 序数 效用 的 关系 。 这 向 话 的 意思 是 ,我 们 不 能 定量 地 衡量 每 种 策略 
组 合 带 来 的 效用 具体 是 多 少 , 但 是 可 以 在 心里 给 它们 排序 ,而 这 也 逐渐 被 其 他 的 科学 理论 
所 证 实 。 美 国 普林斯顿 大 学 心理 教授 丹尼尔 。 卡 尼 曼 (Daniel Kahneman) 经 过 深入 的 研究 
发 现 : 人 们 在 做 决策 时 往往 不 会 严格 估计 正确 的 收益 ,而 比较 容易 快速 地 评价 它们 的 优 劣 。 

实际 上 ,现代 效用 理论 源 于 功利 主义 。 功 利 主 义 是 近 两 个 世纪 以 来 西方 理性 思潮 的 
一 大 主流 。1700 年 ,数理 概率 学 的 基本 理论 开始 发 展 后 不 久 , 效 用 这 一 概念 便 产生 了 。 
例如 ,1738 年 瑞士 数学 家 丹尼尔 。 伯 努 利 (Daniel Bernoull) 曾 观 察 到 : 在 一 场 公平 的 赌 
博 中 ,人 们 认为 所 赢得 的 1 美元 的 价值 小 于 他 们 所 输 掉 的 1 美元 的 价值 。 这 就 意味 着 : 
赢 来 的 美元 带 给 他 们 的 真实 效用 越 来 越 少 。 

最 早 将 效用 概念 引入 社会 科学 的 是 英国 的 哲学 家 杰 里 米 。 边 池 。 他 最 初 研究 法 律 理 
论 , 受 到 亚当 。 斯 密 (Adam Smith) 学 说 的 影响 后 , 转 入 研究 制定 社会 法 则 。 他 建议 社会 
应 该 按 “ 效 用 原则 ”组 织 起 来 ,并 把 效用 原则 定义 为 :“ 任 何 客观 物体 所 具有 的 可 以 使 人 满 
足 , 带 来 好 处 或 幸福 ,或 者 防止 病 苦 、 邪 恶 和 不 幸 的 性 质 。" 根 据 边 兴 的 理论 ,所 有 立法 都 应 
该 按照 功利 主义 原则 来 制定 ,从 而 促进 "最 大 多 数 人 的 最 大 利益 ”。 关 于 犯罪 和 处 罚 , 他 建 
议 通 过 严厉 的 处 罚 来 加 大 犯罪 者 的 痛苦 ,以 阻止 犯罪 活动 的 发 生 。 

边 沁 关 于 效用 的 观点 在 今天 看 来 似乎 很 简单 ,但 在 200 多 年 以 前 ,这 些 观点 颇具 革命 
性 。 在 那 时 ,传统 、 君 主 的 意志 或 是 宗教 的 教义 都 可 以 成 为 制定 政策 的 正当 理由 和 根据 。 
而 边 沁 的 理论 开创 性 地 提出 : 社会 和 经 济 政策 的 制定 应 是 为 了 取得 一 定 的 实际 效果 。 

在 效用 理论 发 展 的 下 一 个 阶段 ,诸多 新 古典 经 济 学 家 如 威廉 姆 。 斯 坦 利 。 杰 文 斯 
(William Stanley Jevons) 进 一 步 推广 了 边 江 的 效用 概念 ,用 以 解释 消费 者 行为 。 杰 文 斯 
认为 经 济 理论 是 一 种 “对 快乐 和 痛苦 的 计算 ”, 他 认为 理性 的 人 在 消费 时 作 决 定 ,应 该 考虑 
要 买 的 每 一 件 商品 给 自己 带 来 的 效用 (或 称 边际 效用 )。 

杰 里 米 。 边 沁 , 请 让 我 们 记 住 这 个 名 字 。 虽 然 在 经 济 学 领域 ,他 不 如 亚当 。 斯 密 、 约 
翰 。 斯 密 (John Simy) 约翰， 梅 纳 德 ， 饥 思 斯 (John Maynard Keynes) 这 些 名 字 般 如 雷 
贯 耳 ,但 他 是 第 一 个 将 苦 与 乐 量化 的 人 。 他 的 功利 主义 效用 度量 观点 无 疑 是 经 济 学 最 重 
要 的 思想 来 源 之 一 。 


1.2.2 博弈 的 信息 结构 


在 上 节 对 《英雄 联盟 ) 的 分 析 中 ,我 们 使 用 了 “ 甲 知道 自己 应 该 如 何 选 择 , 乙 也 知道 甲 
的 选择 , 甲 知 道 乙 知道 甲 的 选择 , 乙 知 道 甲 知 道 乙 知道 甲 的 选择 ……” 这 样 的 推理 方式 。 
一 般 而 言 , 甲 是 理性 的 并 不 意味 着 乙 知 道 甲 是 理性 的 ,更 不 意味 着 甲 知 道 乙 知道 甲 是 理性 
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的 …… 因 此 ,“ 乙 知道 甲 是 理性 的 "实际 上 对 乙 的 理性 程度 做 了 比 “ 甲 是 理性 的 "和 “ 乙 是 理 
性 的 ”更 高 的 要 求 。 反 之 亦 然 。 更 进一步 ,“ 甲 知道 乙 知 道 甲 是 理性 的 ” 则 是 比 前 述 要 求 更 
高 的 要 求 。 如 此 递 进 ,无 穷尽 也 。 因 此 ,博弈 论 把 这 些 无 限 循环 要 求 抽象 为 一 个 概念 : 共 
同 知识 。 所 谓 共 同 知识 ,是 指 这 样 一 个 事实 : 所 有 参与 者 都 知道 该 事实 ,每 个 参与 者 知道 
其 他 参与 者 知道 ,每 个 参与 者 都 知道 别人 知道 自己 知道 ,如 此 等 等 。 具 体 来 讲 , 上 述 要 求 
可 归结 为 一 个 假设 : 每 个 参与 者 都 是 理性 的 ,这 是 一 个 共同 知识 。 

每 个 参与 者 都 是 理性 的 ,尽管 这 是 一 个 非常 强 的 条 件 , 但 是 已 经 被 普遍 接受 。 此 外 ， 
还 有 一 个 广 为 采 纳 的 共同 知识 : 参与 者 身 处 其 中 的 博弈 。 一 般 来 说 ,无 论 研究 什么 样 的 
博弈 模型 ,这 个 博弈 ( 亦 即 该 博弈 所 必需 的 要 素 组 合 ) 都 是 参与 者 们 的 共同 知识 。 例 如 ， 
“酒吧 问题 "中 的 参与 者 都 有 谁 ,所 有 参与 者 的 可 能 行动 是 什么 ,每 个 参与 者 的 效用 函数 是 
什么 ,等 等 。 又 如 “ 金 球 "节目 中 共有 两 个 参与 者 ,选手 们 的 可 能 选择 是 (平分 , 偷 走 ), 以 及 
每 个 行动 所 对 应 的 得 益 函 数 ,等 等 ,都 是 作为 共同 知识 出 现 的 。 

实际 上 ,共同 知识 是 博弈 论 中 一 个 非常 强 的 假定 。 在 现实 的 许多 博弈 中 ,即使 参与 人 
“共同 ?享有 某 种 知识 ,每 个 参与 人 也 许 并 不 知道 其 他 参与 人 知道 这 些 知识 ,或 者 并 不 知道 
其 他 人 知道 自己 拥有 这 些 知 识 。 就 博弈 的 要 素 而 言 , 是 否 假定 共同 知识 将 直接 影响 博弈 
的 信息 结构 。 作 为 导论 ,我 们 主要 介绍 两 类 信息 是 否 为 参与 者 所 知 : 一 类 是 得 益 的 信息 ， 
另 一 类 是 过 程 的 信息 。 

首先 ,关于 得 益 的 信息 。 它 指 每 个 参与 者 在 每 一 种 策略 组 合 下 的 结果 所 对 应 的 得 益 
状况 。 在 上 节 所 遇 到 的 3 个 博弈 中 ,每 个 参与 者 不 仅 对 自己 在 所 有 状况 下 的 得 益 非常 清 
楚 , 而 且 对 其 他 人 在 所 有 状况 下 的 得 益 也 非常 清楚 。 因 此 所 有 参与 者 才能 一 致 地 预测 均 
衡 。 如 果 存 在 某 一 个 或 几 个 参与 者 的 信息 不 为 他 人 所 知 , 仅 是 自己 的 私人 信息 , 则 称 该 博 
弈 是 信息 不 完全 的 。 若 参与 者 的 得 益 是 共同 知识 , 则 称 该 博弈 是 “完全 信息 博 窦 ”"。 否 则 ， 
至 少 部 分 参与 者 不 完全 了 解 其 他 参与 者 的 得 益 , 此 时 称 之 为 “不 完全 信息 博弈 "。 关 于 不 
完全 信息 博弈 的 详细 介绍 请 参见 第 5 章 。 

其 次 ,关于 过 程 的 信息 。 让 我 们 先 看 一 个 猜 硬 币 博弈 。 两 人 在 玩 猜 硬币 博弈 ,首先 是 
盖 硬 币 方 选择 1 元 硬币 的 正面 (有 面额 的 一 面 ) 向 上 还 是 反面 向 上 ,然后 将 之 盖 在 桌面 上 。 
猜 硬币 方 猜 正 面向 上 还 是 反面 向 上 。 如 果 猜 对 了 , 则 猜 硬币 方 赢得 1 元 , 盖 硬 币 方 输 1 
元 。 和 否则 , 猜 硬币 方 输 给 盖 硬 币 方 1 元 。 在 这 个 博弈 中 ,所 有 参与 者 、 参 与 者 的 行动 集合 
以 及 每 个 结果 所 对 应 的 得 益 都 是 共同 知识 。 但 是 ,注意 到 这 个 博弈 是 有 行动 次 序 的 ,可 依 
照 双方 的 行动 次 序 画 出 树 状 图 。 首 先是 盖 硬 币 方 的 两 个 选择 : 正面 向 上 ,反面 向 上 。 无 
论 盖 硬 币 方 如 何 行动 , 猜 硬币 方 都 面临 两 个 选择 : 猜 正 面向 上 , 猜 反面 向 上 。 因 此 ,共有 
2X2 四 种 结果 ,对 应 得 益 如 图 1-6 所 示 , 这 是 一 个 动态 博弈 。 从 博弈 的 要 素来 看 , 它 属 于 
扩展 式 博 弈 这 一 类 。 因 此 ,图 1-6 被 称 为 该 博弈 的 扩展 式 表示 。 假 如 现在 轮 到 猜 硬币 方 
行动 ,那么 ,硬币 到 底 正 面向 上 还 是 反面 向 上 ,他 是 不 知道 的 。 因 此 ,在 图 1-6 中 猜 硬 币 方 
不 知道 自己 处 在 左 侧 还 是 右 侧 节点 上 。 博 弈 论 认 为 此 时 猜 硬币 方 处 于 多 节点 信息 集 。 要 
在 多 节点 信息 集 做 出 准确 无 误 的 行动 将 是 非常 困难 的 ,因为 同一 个 行动 在 不 同 节点 上 对 
应 完全 相反 的 结果 。 我 们 称 猜 硬 币 方 的 过 程 信息 是 不 完美 的 。 类 似 的 情境 比比 皆 是 。 例 
如 ,在 扑克 游戏 中 车 有 人 忘记 了 对 手 是 否 出 过 某 张 牌 ,此 时 他 无 法 辨 明 自 己 处 于 “出 过 ”和 
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“ 没 出 过 ”这 两 个 节点 中 的 哪 一 个 上 。 
一 般 而 言 , 如 果 所 有 参与 者 对 博弈 过 程 都 完美 地 了 解 , 意 即 博弈 的 后 行动 者 能 够 观察 
到 (并 完美 回忆 ?所 有 的 历史 行动 ,就 称 该 博弈 是 完美 信息 博弈 。 在 决策 时 对 博弈 过 程 完 
全 了 解 的 参与 者 被 称 为 完美 信息 参与 者 。 反 之 .分别 对 应 不 完美 信息 博弈 和 不 完美 信息 
参与 者 。 上 述 分 类 如 图 1-7 所 示 。 为 了 便于 理解 , 接 下 来 举例 说 明 。 
益 硬 币 方 


猜 硬 币 方 《 


本 得 益 信息 过 inp 
sek $4 Eee 
程 信息 Ee 

-1,1) (= {1D (l=) Re “完美 信息 博弈 


图 1-6 猜 硬币 博弈 图 1-7 信息 博弈 分 类 


(1) 完全 且 完 美 信息 博弈 : 如 象棋 对 弈 。 对 弈 双方 都 知道 每 局 结束 所 对 应 的 得 益 ， 
也 知道 自己 处 于 博弈 树 形 图 (扩展 式 ) 的 哪 一 步 一 一 即使 忘记 了 历史 行动 ,看 看 棋盘 便 知 ， 
不 会 与 其 他 棋局 混淆 。 

(2) 完全 但 不 完美 信息 博弈 : 如 常见 的 麻将 游戏 。 在 打 麻 将 过 程 中 ,所 有 玩家 都 对 
各 种 结果 (“和 有 牌 ”) 所 对 应 的 输赢 数额 一 清二 楚 , 也 知道 麻将 的 规则 ,此 为 信息 完全 。 但 
是 ,所 有 玩家 都 不 知道 其 他 玩家 手中 的 牌 ,这 是 不 完美 信息 。 例 如 , 某 一 玩家 打出 “会 万 ”， 
其 他 玩家 不 知道 该 玩家 是 否 还 有 一 个 "会 万 ”, 因 此 其 他 玩家 无 法 断定 该 玩家 到 底 处 于 
“有 ”和 “没有 ”这 两 个 节点 中 的 哪 一 个 上 。 

(3) 不 完全 信息 博弈 : 如 情侣 之 间 的 表白 。 假 设 一 个 男生 向 一 个 女生 表白 ,男生 有 
(表白 ,沉默 ) 两 种 策略 (行动 ) ,女生 有 (拒绝 ,接受 ) 两 种 策略 。 虽然 男 生 对 4 种 策略 组 合 
给 自己 所 带 来 的 得 益 能 够 主观 感知 ,但 是 他 不 知道 对 方 的 真实 感受 。 女 生 亦 如 此 。 所 以 ， 
当 你 尝试 用 前 文 的 矩阵 来 表示 这 个 博弈 的 时 候 , 将 会 发 现 这 个 静态 博弈 矩阵 无 法 表 出 。 


pd 扩展 阅读 : 华容 道 放 草 


在 博弈 论 中 ,许多 模型 在 “理性 是 参与 者 的 共同 知识 ”假定 下 便 可 轻易 地 求 得 均衡 解 。 
但 是 ,现实 中 的 行为 或 多 或 少 都 会 偏离 理论 预测 。 造 成 这 种 偏离 的 原因 是 多 方面 的 , 既 
有 系统 性 的 ,也 有 模型 方面 的 。 而 对 于 后 者 而 言 , 关 于 共同 知识 的 假设 则 是 在 建 模 过 
程 中 易 受 质疑 的 地 方 。 璧 如,《 三 国 演义 ) 中 曹操 败 走 华容 道 这 一 情节 。 让 我 们 来 看 当 
时 的 情境 。 

“ 正 行 时 , 军 至 路 口 ,小 路 山 边 有 数 处 烟 起 ; 大 路 并 无 动静 。 操 令 教 前 军 走 华容 道 小 
路 。 诸 将 日 : “烽烟 起 处 , 必 有 军马 ,何故 反 走 这 条 路 ?? 操 日 :“……… 诸葛 亮 多 谋 , 故 使 人 
于 山 僻 烧 烟 , 使 我 军 不 至 从 这 条 山路 走 , 他 却 伏兵 于 大 路 等 着 。 吾 料 已 定 , 偏 不 教 中 他 
计 !17 诸 将 尼 日 : “丞相 妙 算 ,人 不 可 及 。" 遂 勒 兵 走 华 容 道 。 
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ee 又 行 不 到 数 里 , 操 在 马上 扬 革 大 笑 。 众 将 问 :“ 丞 相 何 又 大 笑 ?? 操 日 :“ 人 器 言 
周瑜 .诸葛 亮 足 智 多 谍 ,以 吾 观 之 ,到 底 是 无 能 之 华 。 若 使 此 处 伏 一 旅 之 师 , 吾 等 尼 束 手 受 
缚 疾 。 

言 未 毕 ,一声 炮 响 , 两 边 五 百 校 刀 手 摆 开 ,为首 大 将 关 云 长 , 提 青 龙 刀 , 跨 赤 免 马 , 截 住 
去 路 。” 

根据 理性 是 共同 知识 的 假设 ,显然 曹操 是 理性 的 ,诸葛 亮 是 理性 的 ,曹操 知道 诸葛 亮 
理性 ,诸葛 亮 也 知道 曹操 理性 ,如 此 等 等 。 但 事实 是 曹操 错 了 (此 处 意 指 还 有 更 好 的 行动 
可 选 ) ,那么 他 错 在 了 哪里 ? 你 可 据 此 质疑 曹操 的 理性 ,认为 理性 是 共同 知识 这 一 假设 在 
该 博弈 中 不 适用 。 但 是 ,如 果 否 定 这 一 假设 , 则 对 它 的 分 析 之 路 从 一 开始 就 被 堵 死 了 。 实 
际 上 ,在 与 此 类 似 的 诸多 模型 中 ,博弈 论 仍然 坚持 “参与 者 的 理性 是 共同 知识 ”这 一 假设 ， 
转 而 利用 混合 均衡 、 颤 样 手 均衡 或 参与 者 的 信念 进行 解释 。 壁 如 ,你 仍 可 认为 曹操 是 理性 
的 ,但 是 他 的 信念 出 了 些 错误 , 意 即 他 对 诸葛 亮 在 小 路 伏兵 的 可 能 性 做 出 了 错误 的 推断 ， 
与 客观 概率 不 符 。 


1.3 博弈 再 举例 


在 初步 了 解 博弈 的 基本 知识 后 ,本 节 将 介绍 一 些 博弈 论 中 非常 经 典 的 例子 。 这 些 例 
子 不 仅 使 专业 的 博弈 论 学 者 着 迷 , 也 使 普通 民众 兴致 餐 然 。 同 学 们 甚至 常常 边 走边 讨论 
一 个 有 趣 的 问题 ,有 时 会 因为 一 个 结论 而 争吵 得 面红耳赤 。 当 然 更 多 时 候 , 大 家 会 为 博弈 
论 的 奇妙 而 惊叹 。 


1.3.1 价格 战 


并 引 语 故 事 : 疯狂 的 共享 单车 


图 1-8 所 示 为 数量 众多 的 共享 单车 。2017 年 1 月 13 日 上 午 9 点 半 , 北 京 国贸 商 圈 ， 
很 多 上 班 族 出 地 铁 后 ,直接 骑 上 一 辆 共享 单车 ,前 往 商 圈 各 个 写字 楼 或 者 大 酒店 。 

几乎 每 一 个 新 入 场 的 共享 单车 品牌 ,都 会 选择 先 把 单车 投放 到 CBD( 中 央 商 务 区 ) 地 
区 。 除 了 人 流量 大 、 潜 在 用 户 多 的 因素 外 ,CBD 还 是 一 个 没有 资金 门槛 的 广告 场所 。 随 
着 共享 单车 公司 竞争 加 剧 , 越 来 越 多 的 共享 单车 被 投放 到 城市 里 的 人 流 密集 地 一 一 地 铁 
口 .各 大 商 圈 、 写 字 楼 、 公 交 站 和 大 型 小 区 附近 。 

然而 ,共享 单车 都 面临 着 一 个 难题 想 赚钱 很 难 。 共 享 单车 行业 最 流行 的 盈亏 计 
算 公 式 是 : 一 辆 单车 平均 每 天 被 使 用 3 次 ,一 年 有 300 天 可 能 被 使 用 ,年 收入 就 是 900 
元 。900 元 也 是 行业 平均 单车 成 本 线 , 如 果 再 加 上 20 左右 的 运营 成 本 ,肯定 没 法 盈利 。 

在 国外 ,很 多 共享 单车 的 收费 标准 是 半 小 时 5 美元 ,所 以 很 多 国外 共享 单车 公司 靠 收 
骑 行 费 就 能 轻松 盈利 。 但 国内 共享 单车 的 价格 基本 都 是 半 小 时 5 毛 或 1 元 ,这 个 定价 跟 
公交 车 差不多 。 公 交 公 司 主要 是 靠 政 府 补 贴 维持 生存 。 对 于 共享 单车 来 说 ,如 果 不 能 拿 
到 融资 ,基本 很 快 就 会 被 市 场 清洗 出 局 。 
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图 1-8 数量 众多 的 共享 单车 


某 单 车 品牌 创始 人 认为 ,目前 价格 战 很 惨烈 ,大 家 都 没 法 赚钱 。 所 以 他 的 公司 目前 没 
有 大 规模 在 大 街 上 “ 扔 车 ”。 
一 《南方 周末 》,2017 年 1 月 19 日 ,疯狂 的 单车 


在 引 语 故事 的 结尾 ,我 们 看 到 某 公 司 的 选择 是 避免 大 规模 投放 单车 。 那 么 ,既然 创始 
人 认识 到 了 问题 的 根源 ,就 应 该 提高 价格 。 他 们 为 什么 舍 近 求 远 ? 此 外 ,认识 到 这 点 的 公 
司 应 该 不 止 一 家 ,他 们 为 什么 不 统一 提 价 ? 

简单 起 见 ,我 们 假设 市 场 上 有 两 家 单车 品牌 公司 : 清风 和 致远 。 两 家 公司 推出 类 似 
的 单车 运营 服务 , 且 共 同 垄 断 着 同一 市 场 。 为 了 获得 更 大 的 市 场 份额 ,两 家 公司 需要 各 自 
决定 采用 高 价 (如 5 元 ) 还 是 低 价 ( 如 1 元) 的 运营 策略 。 

(1) 如 果 两 家 公司 都 选择 低 价 ,公司 的 运营 收入 就 是 引 语 故 事 中 的 状况 ,为 每 年 900 
元 / 辆 。 公 司 不 但 没 盘 利 ,反而 可 能 亏损 。 

(2) 如 果 两 家 公司 都 选择 高 价 , 公 司 的 运营 收入 为 每 年 1200 元 / 辆 ,这 样 两 家 公司 都 
稍 有 盘 利 。 

(3) 如 果 只 有 "清风 ”提高 价格 ,“ 致 远 ” 则 能 够 吸引 到 更 多 的 客户 ,这 样 “ 清 风 ” 将 会 更 
惨淡 。 不 妨 假设 “清风 “致远 ”的 收入 分 别 为 (600,1 500)。 

(4) 如 果 只 有 “致远 ”提高 价格 ,情形 与 (3) 类 似 , 二 者 的 收益 如 图 1-9 所 示 。 


致远 
高 价 低 价 
高 价 | (1200， 1200) (600，1500) 
浦 低 价 | 1500，600) | oo 900) 


图 1-9 双 寒 头 的 前 价 竞争 


第 1 章 导 论 19 


目前 ,两 家 公司 都 在 低 价 状态 挣扎 。 假 设 * 清 风 ? 要 单方 面 提 价 , 它 需要 在 "致远 ”采取 
低 价 的 状态 下 比较 自己 两 个 行动 所 对 应 的 得 益 , 意 即 比较 600 和 900。 显 然 ,900 得 益 更 
好 ,因此 ,“ 清 风 ” 仍 然 采 取 低 价 。 对 “致远 ”的 分 析 与 此 类 似 。 进 一 步 ,假设 “清风 ”已 经 在 
高 价 状态 ,我 们 来 看 “致远 ”的 反应 “致远 ”需要 比较 在 “清风 ”高 价 时 自己 的 两 个 得 益 。 
换言之 “致远 ?比较 图 1-9 矩阵 第 一 行 两 个 组 合 中 的 第 二 个 元 素 ,1 200 和 1 500。 显 然 ， 
“致远 ”更 愿意 选择 低 价 。 所 以 ,无 论 * 清 风 ? 是 否 高 价 “致远 ”的 策略 始终 是 低 价 占 优 。 
“清风 ?也 一 样 。 所 以 ,该 博弈 的 均衡 是 双方 都 坚持 ( 低 价 , 低 价 ) 。 尽 管 低 价 将 会 使 得 两 败 
俱 伤 ,但 是 双方 仍然 坚持 低 价 策略 。 这 就 是 价格 战 一 一 囚徒 困境 的 男 一 种 表现 。 

在 这 个 博弈 中 ,存在 而 且 仅 存在 一 个 均衡 。 因 此 ,参与 者 双方 能 够 一 致 地 预测 到 均衡 
并 心 无 旁 属 地 朝 着 均衡 行动 。 当 然 , 在 均衡 状态 下 ,你 愿意 而 且 我 愿意 ”, 谁 都 没有 动机 
单方 面 偏离 。 但 是 ,并 不 是 所 有 的 博弈 都 这 么 完美 ,存在 唯一 的 一 个 均衡 。 实 际 上 ,有 些 
博弈 可 能 没有 均衡 (此 处 仅 指 纯 策略 纳什 均衡 ,读者 还 将 学 习 到 更 多 的 均衡 概念 ), 而 有 些 
博 穿 又 存在 多 个 均衡 ,甚至 无 限 个 均衡 。 接 下 来 我 们 将 介绍 上 述 的 博弈 情形 。 


2 扩展 阅读 : 价格 战 与 反 价格 战 协 定 


著名 经 济 学 家 N. 格雷 器 里。 曼 昆 (N. Gregory Mankiw) 在 人 经济 学 原理 》 一 书 中 从 
经 济 学 的 角度 科学 地 证 明了 价格 战 是 消费 者 选择 的 必然 。 价 格 战 本 身 是 一 种 市 场 竞争 手 
段 ,具有 杀伤 力 强 、 短 平 快 等 诸多 优点 ,被 广大 厂商 所 看 好 和 采用 ,尤其 是 在 一 些 特定 的 行 
业 更 为 普遍 。 如 今 的 “价格 战 ?实际 上 是 指 价格 竞争 ,是 企业 应 用 价格 战略 的 一 个 突出 表 
现 。 价 格 竞争 实际 上 是 市 场 经 济 下 最 基本 的 竞争 形式 ,也 是 最 容易 应 用 的 竞争 形式 。 尽 
管 价 格 战 如 此 常见 ,但 是 很 多 厂家 也 对 它 持 批判 态度 ,言说 它 使 企业 下 失 了 对 产品 核心 价 
值 和 细 分 市 场 的 关注 。 当 然 , 为 了 避免 激烈 竞争 ,也 有 企业 采取 “ 竞 中 有 合 , 合 中 有 竞 ”( 竞 
合 ) 的 策略 ,或 言 反 价格 战 协定 。 

可 口 可 乐 与 百事 可 乐 之 间 的 激烈 竞争 已 经 广为人知 。 但 是 另 有 数据 表明 ,在 美国 市 
场 上 可 口 可 乐 和 百事 可 乐 通过 在 折扣 券 发 放 上 达成 合作 方案 ,得 到 了 对 双方 更 好 的 结果 。 
曾经 在 1 年 的 时 间 里 ,可 口 可 乐 和 百事 可 乐 分 别 发 放 26 周折 扣 券 ,其 间 没 有 出 现 同时 发 
放 的 现象 ,如 果 没 经 约定 ,这 种 事情 发 生 的 概率 小 于 10 的 10 亿 次 方 分 之 一 。 而 作为 彼此 
在 中 国 的 主要 竞争 对 手 , 麦 当 劳 和 肯德基 在 市 场 上 的 竞争 就 激烈 得 多 ,但 是 在 折扣 券 问 题 
上 ,它们 仍然 采用 了 竞 合 策略 。2010 年 2 月 ,麦当劳 宣布 可 以 使 用 肯德基 的 优惠 券 。 


1.3.2 赌 胜 博弈 


2007 年 ,美国 拉 斯 维 加 斯 ,大 卫 在 一 项 紧张 激烈 的 国家 锦标 赛 中 赢得 了 5 万 美金 ! 
而 赛事 内 容 却 出 人 意料 ,是 3 岁 儿 童 都 会 玩 的 “剪刀 石头 \ 布 ".。“ 剪 刀 \ 石 头 \ 布 ?之 所 以 
广 受 欢迎 ,一 是 因为 规则 简单 ,二 是 因为 能 够 相对 公平 地 解决 分 歧 。 之 所 以 说 “公平 ”, 是 因 
为 从 表面 上 看 ,出 石头 .剪刀 和 布 的 概率 均 为 1/3, 因 此 每 局 游戏 胜 负 平 的 概率 分 别 为 1/3。 

假设 大 卫 和 好 友 阿 米尔 在 玩 * 剪 刀 \` 石 头 \ 布 游戏。 双方 都 在 “剪刀 \ 石 头 \ 布 ?三 种 手 
势 中 任 选 其 一 。 若 二 人 所 选择 的 手势 相同 , 则 为 平局 ; 否则 ,石头 胜 于 剪刀 ,剪刀 胜 于 布 ， 
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布 胜 于 石头 。 对 于 任 一 参与 者 , 若 平局 ,得 0 分 ; 若 胜 一 局 ,得 1 分 ; 若 败 一 局 ,得 一 1 分 。 
二 者 的 得 益 矩 阵 如 图 1-10 所 示 。 
大 卫 
石头 剪刀 布 
石头 (0, 0) (1, -1) {Els 
阿 米尔 ”剪刀 
布 


图 1-10 “剪刀 ` 石 头 \ 布 "游戏 的 得 益 矩 阵 


阿 米 尔 在 做 出 选择 前 ,需要 对 大 卫 的 行动 做 出 最 佳 应 对 。 假 设 大 卫 出 “石头 ”, 则 阿 米 
尔 的 最 佳 选择 是 “ 布 "。 这 个 结论 相当 直观 。 既 可 以 通过 比较 自己 在 三 种 选择 下 的 得 益 推 
得 ,也 可 由 游戏 规则 直接 得 出 。 你 可 以 对 图 1-10 中 的 得 益 矩 阵 进 行 一 些 简单 操作 ,在 最 
佳 得 益 下 面 画 线 。 此 时 ,应 在 矩阵 第 1 列 第 3 行 的 第 1 个 得 益 1 下面 画 线 。 同 理 , 当 大 卫 
出 “剪刀 ?时 , 阿 米尔 的 最 佳 选择 是 “石头 ”; 大 卫 出 * 布 "时 阿 米 的 最 佳 选择 是 “剪刀 ”。 分 
别 在 第 2 列 第 1 行 和 第 3 列 第 2 行 的 第 1 个 得 益 下 面 画 线 。 

同 理 ,对 于 大 卫 的 分 析 与 上 述 情况 类 似 。 对 应 操作 为 在 第 1 行 第 3 列 . 第 2 行 第 1 
列 和 第 3 行 第 2 列 的 第 2 个 得 益 下 面 画 线 。 综 合 可 得 画 线 后 的 得 益 矩 阵 如 图 1-11 所 示 。 

大 卫 
石头 剪刀 布 


石头 (0, 0) 
阿 米尔 ”剪刀 


布 


DD | CD 
(0 0 | 0 -0 
(C1, 1) 


(1, 1) 
(1, -1) 


(0, 0) 


图 1-11 “剪刀 .石头 、 布 "游戏 画 线 后 的 得 益 矩 阵 


从 图 1-11 中 可 以 看 到 ,并 不 存在 一 个 策略 组 合 的 两 个 元 素 同 时 被 画 线 。 这 意味 着 并 
不 存在 一 个 使 得 双方 都 愿意 采纳 的 策略 组 合 。 因 此 ,该 博弈 不 存在 前 述 几 个 例子 中 所 谓 
的 “均衡 "。 不 难 想象 ,如 果 存 在 多 轮 游戏 ,两 个 参与 者 的 博弈 应 该 是 这 样 的 : 由 于 不 存在 
所 谓 的 “均衡 ,因此 双方 达 不 到 一 个 稳定 的 状态 , 亦 即 都 有 动机 单方 面 偏离 。 所 以 ,双方 
不 停 地 变换 行动 以 使 得 对 方 猜 不 透 自 己 的 选择 。 进 而 ,读者 不 难 推断 这 样 的 一 个 事实 : 
由 于 三 个 选择 是 对 称 的 ,博弈 双方 都 依照 1/3 的 概率 选择 自己 的 行动 。 

诸如 “剪刀 石头 布 ”“ 猜 硬币 交 掷 货 子 "这 类 游戏 ,都 属于 赌 胜 博弈 。 赌 胜 博 弈 是 博弈 
论 所 研究 的 一 类 重要 问题 ,对 竞争 和 合作 行为 也 有 很 大 启示 。 赌 胜 博弈 的 一 个 重要 特点 
是 一 方 的 所 得 等 于 另 一 方 的 失去 ,不 可 能 出 现 双赢 的 情况 。 进 一 步 ,在 每 一 轮 博弈 中 , 双 
方 的 得 益 总 和 都 为 0, 此 即 * 零 和 博弈 "。 所 以 ,在 这 类 博弈 中 ,合作 的 空间 非常 小 。 当 然 ， 
合作 现象 并 不 是 不 存在 。 例 如 ,多 方 博 守 有 可 能 出 现 合 谋 现 象 。 
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除了 生活 中 的 游戏 外 ,读者 也 可 以 从 历史 中 寻找 诸多 此 类 的 实例 。 例 如 ,田鼠 赛 
马 ?。 孙 爱 初 到 齐 国 , 齐 国 将 军 田 鼠 非 常 赏识 他 , 待 如 上 宾 。 田 鼠 经 常 与 齐 国 众 公 子 赛马 ， 
设 重金 赌注 。 孙 膀 发 现 他 们 的 马 脚 力 都 差不多 ,而 马 又 可 分 为 上 .中 .下 三 等 。 于 是 , 孙 逐 
对 田鼠 说 :“ 您 只 管 下 大 赌注 ,我 能 让 您 取胜 。? 田 鼠 相 信 并 答应 了 他 ,与 齐 王 和 各 位 公子 
用 千金 来 赌注 。 比 赛 即 将 开始 , 孙 爱 说 :“ 现 在 用 您 的 下 等 马 对 付 他 们 的 上 等 马 , 用 您 的 
上 等 马 对 付 他 们 的 中 等 马 , 用 您 的 中 等 马 对 付 他 们 的 下 等 马 。 三 场 比赛 结束 ,田鼠 一 场 败 
而 两 场 胜 , 最 终 赢 得 齐 王 的 千金 财 注 。 于 是 田鼠 把 孙 逐 推荐 给 齐 威 王 。 

田 忌 赛 马 的 故事 讲 的 是 孙 爱 如 何 运 筹 来 帮助 田鼠 战胜 齐 王 。 如 果 他 们 的 赛马 比赛 定 
期 举行 ,那么 齐 王 就 会 从 中 意识 到 问题 所 在 ,继而 采取 应 对 策略 。 那 么 这 时 的 “田鼠 赛马 ” 
就 从 决策 问题 变 成 了 对 策 问 题 ,而 所 属 研究 领域 也 从 运筹 学 变 成 了 博弈 论 。 


分 思考 与 练习 


在 田 忌 赛马 的 故事 中 ,假设 田 忌 和 齐 王 都 足够 聪明 .足够 理性 。 双 方 都 尽力 组 合 马 的 
出 场 顺 序 , 那 么 ,各 有 6 种 方案 。 此 时 应 当 如 何 将 该 博弈 表示 成 类 似 “ 剪 刀 石 头 布 ?的 矩阵 
结构 ? 你 能 分 析 这 个 博弈 的 均衡 是 什么 吗 ? 


2 扩展 阅读 : 非 合 作 竞 争 


人 在 一 个 非 合 作 性 的 比赛 或 竞争 中 ,会 做 怎样 的 决定 ,一 直 是 个 重要 的 疑问 ,吸引 了 
很 多 人 进行 研究 。 而 像 "剪刀 石头 布 ” 这 种 简单 的 博弈 游戏 ,就 可 以 作为 一 种 基本 模型 来 
讨论 。 对 于 一 个 人 而 言 ,并 不 是 足够 聪明 、 足 够 理性 就 能 使 得 自己 的 行为 符合 最 优 策略 ， 
其 间 还 有 个 人 的 偏好 在 起 作用 。 

伦敦 大 学 学 院 的 理 查 德 。 库 克 (Richard Cooker) 曾 进行 过 一 项 实验 。 他 让 45 个 人 
两 两 对 决 (注意 不 是 两 两 一 组 ,而 是 两 两 轮流 对 决 ) ,并 以 现金 做 奖品 。 每 一 局 都 需要 蒙 上 
一 方 或 双方 的 眼睛 。 库 克 发 现 , 有 一 方 蒙 住 眼 睛 时 平局 出 现 的 概率 为 36. 3 中 ,而 双方 都 
蒙 上 眼睛 时 平局 的 概率 下 降 到 33.3%。 后 者 才 是 随机 出 拳 时 平局 该 有 的 概率 ,二 者 的 显 
著 差 距 说 明 前 者 并 非 绝 对 随机 。 

这 是 一 个 有 趣 的 现象 : 在 一 方 睁 眼 、 一 方 蒙 眼 的 比赛 中 ,平局 的 概率 大 大 上 升 。 睁 有 眼 
的 选手 ,“ 出 招 ” 的 时 间 要 比 蒙 眼 者 慢 上 200 毫秒 左右 。 照 理 说 , 晚 出 招 应 该 是 优势 ,怎么 
会 导致 胜率 下 降 、 平 局 增多 呢 ? 事实 上 , 当 我 们 看 到 对 方 出 拳 时 ,会 下 意识 地 、 自 发 地 去 模 
仿 对 方 。 睁 眼 的 一 方 ,可 能 受 此 影响 ,“ 乱 了 心绪 ”, 而 输 掉 了 机 会 。 这 就 解释 了 平局 激增 
的 原因 。 

浙江 大 学 曾 利用 实验 研究 了 人 们 的 行为 偏好 。 他 们 的 成 果 入 选 了 BBC*2014 年 度 科 
技 新 闻 亮 点 ”及 《 麻 省 理工 科技 评论 )2014 年 度 最 佳 。 他 们 的 主要 发 现在 于 个 体 行为 存在 
一 种 隐藏 的 模式 : 在 一 定 情况 下 , 赢 了 会 更 多 选择 保留 刚刚 获胜 的 策略 , 输 了 则 更 多 按照 
“石头 剪刀 布 ?的 名 称 顺 序 变 动 , 而 平 的 则 按照 “石头 布 剪刀 ?这样 的 反方 向 顺序 变动 。 这 
些 发 现 有 什么 深远 意义 呢 ? 他 们 指出 ,在 宏观 尺度 ,对 于 不 同 激励 参数 ,社会 系统 普遍 存 
在 持续 的 周期 循环 现象 ; 而 在 微观 层面 ,个 体 行 为 则 存在 上 述 的 隐藏 模式 。 并 且 , 对 于 不 
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同 激励 参数 ,宏观 周期 现象 都 可 以 被 微观 行为 模式 很 好 地 解释 。 若 你 对 此 感 兴趣 ,可 利用 
网 络 搜索 更 多 结果 。 


1.3.3 夫妻 战争 


在 许多 电视 娱乐 节目 中 , 常 有 考验 夫妻 默契 程度 的 小 游戏 。 例 如 ,节目 中 的 夫妻 二 人 
站 在 用 挡 板 隔 开 的 背景 墙 下 , 面 对 主 持 人 和 观众 。 然 后 ,主持 人 提出 一 个 问题 ,请 二 人 利 
用 肢体 语言 或 白板 文字 来 作答 ,不 允许 有 任何 交流 。 主 持 人 所 提 的 问题 五 花 八 门 ,不 一 而 
足 。 例 如 ,主持 人 会 问 * 生 活 中 如 何 向 对 方 表达 * 我 爱 你 ”。 如 果 两 人 说 出 的 答案 相同 , 则 
各 自 加 1 分 ; 否则 ,得 分 为 0。 假 如 在 实际 相处 中 妻子 习惯 用 “亲吻 ”来 表达 ,而 丈夫 常常 
“拥抱 ”对 方 。 显 然 二 人 不 会 如 实 回答 ,而 是 策略 性 选择 一 种 , 意 即 他 们 必须 在 两 个 动作 之 


间 做 出 选择 。 准 确 来 讲 ,各 自 都 需要 揣 度 对 方 的 先 
择 。 假 设 丈 夫 认 为 妻子 选择 “拥抱 ”, 显 然 ,他 也 选 拥抱 麻风 
择 “ 拥 抱 "是 最 佳 的 。 如 果 他 认为 妻子 选择 “亲吻 ”， ee 
则 和 已 也 所" 玉 "为 上 从 时 前 文 的 而 线 广 法 ， x | | 


丈夫 
亲吻 
将 二 人 博弈 的 矩阵 元 素 进 行 画 线 , 如 图 1-12 所 示 。 Low lun 


可 见 ,夫妻 二 人 同时 选择 “拥抱 ”或 “亲吻 ”是 这 图 1-12 夫妻 战争 的 得 益 和 矩阵 
个 游戏 的 均衡 ,双方 都 愿意 。 假 如 有 一 方 有 动机 偏 
离 , 那 么 紧 接 着 他 就 会 发 现 如 此 行为 并 不 能 获 益 。 因 此 ,只 要 有 下 一 次 选择 的 机 会 ,他 还 
会 退回 二 人 已 经 达成 的 均衡 状态 。 

但 是 ,此 处 有 两 个 均衡 。 相 比 没有 找到 均衡 之 前 ,二 人 的 选择 难度 并 没有 降低 多 
少 一 一 原因 在 于 夫妻 二 人 很 难 一 致 地 锁定 一 个 均衡 。 事 实 也 确实 如 此 : 即使 二 人 都 知 
道 , 但 是 行动 仍然 不 一 致 。 如 果 换 作 夫妻 二 人 就 某 些 自 利 的 事情 做 选择 ,那么 ,二 人 之 间 
的 不 一 致 则 更 容易 导致 夫妻 冲突 。 因 此 ,这 个 博弈 也 称 为 “夫妻 战争 "。 例 如 ,在 只 有 一 台 
电视 机 的 情况 下 ,如 果 丈 夫 嘉 欢 足 球 频 道 而 妻子 更 喜欢 娱乐 频道 则 很 容易 引发 冲突 。 当 
然 , 如 果 夫 妻 之 间 感 情 深 厚 ,相互 为 对 方 着 想 , 可 能 会 少 有 冲突 ,但 不 可 完全 避免 。 例 如 ， 
欧 ， 享 利 小 说 ( 麦 琪 的 礼物 ) 中 的 德 拉 和 吉姆 。 德 拉 对 自己 的 一 头 秀 发 珍爱 有 加 、 引 以 为 
豪 ,但 为 了 给 丈夫 买 一 件 “ 精 致 .珍奇 而 真正 有 价值 ”的 圣诞 礼物 ,她 忍痛 割爱 ,为 丈夫 买 了 
珍贵 的 白金 表 链 。 吉 姆 努力 工作 却 薪 水 菲 薄 , 但 他 深 知 爱 妻 对 一 家 商店 橱窗 里 陈列 的 发 
梳 渴望 已 久 ,于 是 忍痛 卖 掉 了 三 代 祖传 的 金 表 。 如 此 一 来 ,二 人 的 选择 就 错位 了 。 

实际 上 ,这 样 的 实例 在 生活 中 屡见不鲜 。 春 游 中 同学 们 的 偏好 不 同时 应 该 如 何 确定 
旅游 景点 ?新 婚 夫妻 该 回 谁 家 过 年 ? 你 与 生意 伙伴 意见 相左 时 应 该 如 何 决 策 ? 在 合作 完 
成 的 作品 中 只 能 署名 1 人 时 应 该 选择 谁 ? 也 许 你 会 自然 想到 采用 沟通 和 协调 来 解决 参与 
者 的 选择 冲突 。 但 是 ,并 不 是 所 有 的 场合 都 能 够 进行 沟通 和 协调 。 即 便 能 ,所 谓 的 沟通 和 
协调 是 双方 真实 意图 的 传达 吗 ? 又 真 的 能 够 消解 冲突 吗 ? 

当然 ,本 书 给 读者 介绍 的 是 更 具 一 般 性 的 知识 。 除 了 具有 唯一 均衡 的 博弈 情景 ,上 述 
两 种 博弈 情景 (包括 具有 两 个 均衡 的 和 没有 均衡 的 博弈 ) 都 会 带 来 相同 的 问题 : 这 种 均衡 
对 参与 者 是 否 具有 指导 意义 ? 能 否 保证 均衡 的 一 致 预测 性 和 普遍 适用 性 ?沟通 和 协调 能 
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够 使 得 双方 的 结果 更 好 吗 ? 在 稍 后 章节 的 具体 介绍 中 ,你 将 会 找到 答案 。 
1.3.4 海盗 分 金 


“海盗 分 金 ”, 早 年 作为 一 个 经 典 而 有 趣 的 智力 游戏 在 民间 流传 甚 广 。 传 说 某 片 海域 
上 有 5 个 海盗 ,偶然 间 获 得 了 100 枚 金币 。5 个 海盗 都 是 贪 禁 哮 杀 之 徒 , 但 是 又 足够 聪 
明 足够 理性 ,所 以 5 人 一 直 为 如 何 分 配 金币 争执 不 下 。 所 谓 “ 足 够 聪明 、 足 够 理性 ”, 意 即 
海盗 们 是 具有 推理 能 力 的 , 自 利 的 ; 而 自 利 又 意味 着 每 个 海 次 尽力 多 得 (哪怕 一 点 儿 微 
利 ) ,任何 损人 利己 的 事情 都 可 以 干 。 海 瓷 嗜 杀 成 性 则 意味 着 ,即便 无 利 可 图 ,海盗 们 也 宁 
愿 杀人 。 然 而 ,如 果 单 打 独 斗 ,5 人 体力 相当 ,强制 分 配 并 不 可 行 ,争执 不 下 只 得 民主 
表决 。 

具体 表决 程序 如 下 。 首 先 , 由 第 1 个 人 提出 他 的 分 配方 案 , 全 体 海盗 进行 实名 投票 。 
如 果 有 半数 以 上 (不 含 半数 ) 的 人 表示 不 同意 ,那么 方案 不 能 通过 。 第 1 个 海盗 就 会 被 扔 
进 大 海 ,由 第 2 个 海盗 继续 提出 自己 的 方案 。 换 言 之 ,只 要 半数 及 以 上 的 海盗 表示 同意 ， 
那么 方案 就 获得 通过 ,无 须 进 入 下 一 步 。 当 由 第 2 个 人 提出 方案 时 ,与 海盗 1 一 致 , 即 在 
所 剩 海盗 中 如 果 有 半数 以 上 的 人 表示 反对 , 则 方案 不 通过 ,第 2 个 人 被 扔 进 大 海 。 后续 以 


那么 ,5 个 海盗 应 当 如 何 分 配 这 100 枚 金币 呢 ? 按照 直观 的 判断 , 众 口 难 调 之 下 ,无 
任何 参照 的 海盗 1 是 最 危险 的 , 稍 有 不 合理 之 处 就 可 能 毙命 。 而 海盗 5 则 只 需 考 虑 如 何 
得 到 更 多 金币 。 

正面 入 手 来 分 析 可 能 有 些 复杂 ,因为 每 当 有 人 被 扔 进 大 海 ,你 都 要 重新 考量 如 何 分 
配 。 显 然 第 5 个 海盗 不 用 担心 这 个 间 题 ,因为 他 是 最 后 一 个 。 实 际 上 轮 不 到 他 分 配 , 因 为 
只 剩 第 4.5 两 个 海盗 时 他 的 反对 已 经 无 效 了 。 不妨 循 此 思路 ,采用 逆 推 法 ,继续 向 前 分 
析 。 由 此 ,海盗 4 只 须 分 给 第 5 个 海盗 0 枚 ,自己 得 100 枚 。 当 然 ,海盗 4 和 海盗 5 都 知 
道 这 个 事实 ,而 且 知 道 对 方 也 知道 …… 所 以 ,海盗 5 并 不 会 让 结局 走 到 这 一 步 。 在 海盗 3 
分 配 时 ,海盗 5 就 会 争取 利益 。 当 然 :海盗 3 心 知 肚 明 ,他 只 需 给 出 1 枚 金币 拉拢 海盗 5 
同意 自己 的 分 配方 案 ,而 无 须 理会 海盗 4。 

以 此 类 推 , 可 以 得 到 所 有 海盗 的 分 金 方 案 , 如 图 1-13 所 示 。 


| 海盗 5 | 


图 1-13 海盗 分 金 方 案 


结果 出 乎 意料 ,看 似 最 危险 、 最 应 让 利 的 海盗 1 却 获得 金币 最 多 ! 这 是 在 5 人 都 理性 
的 前 提 下 所 得 出 的 结果 ,而 所 使 用 的 方法 则 是 逆向 归纳 法 。 这 种 推理 方法 基于 参与 者 的 
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理性 假设 ,要 求 参与 者 “向 前 展望 , 倒 后 推理 ”。 读 者 可 就 此 进一步 展开 想象 。 这 个 博弈 中 
的 均衡 与 前 几 个 博弈 中 的 均衡 一 样 吗 ? 该 如 何 表示 ? 如 果 海 盗 2 为 了 拉拢 海盗 5 来 反对 
海盗 1 ,从 而 许诺 给 他 分 5 枚 金币 ,那么 这 种 承诺 是 否 可 信 ? 为 什么 现实 中 很 少 发 生 这 种 
极端 的 分 配 ? 关于 这 类 问题 的 细致 分 析 , 本 书 都 有 涉及 ,将 在 稍 后 章节 中 逐步 介绍 


1.4 博弈 的 分 类 


在 给 出 博弈 的 概念 之 后 ,上 节 简 单 介 绍 了 一 些 有 趣 的 .经 典 的 博弈 案例 。 在 本 节 中 ， 
我 们 将 进一步 介绍 博弈 的 知识 ,主要 是 博 穿 的 分 类 。 博 穿 论 在 现实 中 的 应 用 如 此 广泛 ,所 
采用 的 研究 方法 又 如 此 复杂 多 样 ,为 了 从 整体 上 把 握 博 弈 论 的 轮廓 ,系统 地 分 类 似乎 是 必 
要 的 。 分 类 的 参照 既 可 以 是 参与 者 的 数量 、 策 略 集合 的 大 小 ,也 可 以 是 行动 次 序 , 甚 至 信 
息 结构 或 得 益 状 况 ,等 等 。 一 般 来 讲 ,博弈 的 分 类 不 同 , 所 采用 的 研究 方法 相应 不 同 , 有 关 
互动 机 理 的 分 析 也 会 不 同 。 


1.4.1 根据 参与 者 数量 分 类 


从 参与 者 数量 来 看 ,可 将 博弈 分 为 单 人 博弈 ,两 人 博弈 和 多 人 博弈 。 单 人 博弈 在 本 质 
上 是 人 和 自然 的 博弈 ,实际 上 也 是 决策 论 的 研究 内 容 ; 而 双人 博弈 是 两 个 参与 者 之 间 的 
博弈 ,在 博弈 论 中 最 为 常见 ; 一 般 来 讲 , 多 人 博弈 相对 复杂 ,所 以 对 多 人 博弈 的 讨论 比较 
少 一 一 即使 有 ,也 是 一 些 易于 分 析 的 特定 情景 。 

1. 单 人 博弈 

单 人 博弈 的 参与 者 只 有 一 个 。 单 人 博弈 由 于 只 有 一 个 参与 者 (自然 只 是 形式 上 的 参 
与 者 ,不 具有 互动 能 力 ) ,所 以 它 主 要 解决 优化 和 决策 问题 ,属于 运筹 学 和 决策 论 的 范畴 。 

《列子 ) 中 曾 记载 了 一 则 “歧路 亡 羊 ” 的 故事 。 故 事情 节 是 这 样 的 : 

杨 子 的 邻居 家 丢失 了 一 只 羊 。 这 位 邻居 已 经 率领 他 的 家 属 亲友 等 人 去 追寻 ,又 来 请 
求 杨 子 的 信 仆 帮忙 去 追寻 。 杨 子 问 道 :“ 哎 , 丢 了 一 只 羊 。 为 什么 要 这 么 多 人 去 追 呢 ?” 邻 
居 回 答 说 :“ 岔 路 太 多 eR ns dh 令 居 :“ 找 到 羊 了 吗 ?” 令 居 回 答 说 : 
“没有 追 到 ,还 是 让 它 跑 掉 了 。” 杨 子 问 :“ 为 什么 会 让 它 跑 掉 呢 ?” 邻 居 回 答 说 :“ 岔 路 之 中 
又 有 岔路 ,我 们 不 知道 它 到 底 从 哪 条 路 上 跑 了 ， a 好 回来 了 。” 

现在 考虑 一 个 仆人 A 去 追 这 只 羊 , 到 了 一 个 岔路 口 ,面临 如 何 选择 的 问题 。 简 单 起 
见 ,假设 每 条 道路 有 两 个 岔路 ,仆人 到 二 级 岔路 即行 停止 ,不 再 深 追 。 如 果 他 选 对 道路 找 
到 了 羊 , 主 人 会 奖励 他 N 元 赏 钱 。 如 果 找 不 到 ,他 既 没有 任何 收益 ,主人 也 不 会 责 罚 他 。 
而 羊 的 选择 是 随机 的 ,可 将 其 理解 为 “自然 ”, 即 形式 上 的 参与 者 。 关 于 “自然 ”, 在 第 4、5 
章 将 有 更 多 解释 。 如 此 一 来 ,这 个 仆人 的 困 局 就 是 一 个 单 人 博弈 ,模型 如 图 1-14 所 示 。 

这 个 仆人 共有 4 条 路 线 可 供 选 择 , 即 图 1-14 中 的 1,2,3.4。 不妨 假设 羊 的 路 线 是 路 
线 1。 在 括号 中 ,逗号 之 前 代表 的 是 1,2,3,4 号 路 线 ,逗号 之 后 代表 的 是 期 望 收 益 。 

由 于 只 有 一 个 参与 者 ,不 存在 他 与 别人 的 相互 作用 ,因此 这 个 博弈 相对 简单 。 显 然 ， 
仆人 有 4 种 选择 , 若 选择 正确 则 得 到 N 元 赏 钱 , 和 否则 一 无 所 获 。 如 果 这 个 仆人 清楚 知道 4 
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岔路 B 岔路 C 


(1 NI4) (2, NA) (3, NI4) (4, N/4) 


图 1-14 歧路 亡 羊 模型 


种 路 线 所 对 应 的 结果 ,那么 他 肯定 会 选择 导向 路 线 1 的 道路 。 但 是 他 并 不 知道 这 只 羊 实 
际 在 哪 条 道路 上 。 这 就 是 包含 有 不 确定 性 的 单 人 博弈 。 


分 思考 与 练习 


“三 门 问题 ” 亦 称 为 “ 蒙 提 鹤 尔 问题 ”, 出 自 美国 的 电视 游戏 节目 Let's Make a Deal。 
参赛 者 会 看 见 三 扇 关 闭 了 的 门 , 其 中 一 扁 的 后 面 有 一 辆 汽车 。 选 中 这 扁 门 可 赢得 一 辆 汽 
车 ,另外 两 扇 门 后 面 则 各 藏 有 一 只 山羊 。 当 参赛 者 选 定 一 扇 门 但 尚未 开启 的 时 候 , 节 目 主 
持 人 打开 剩 下 两 扇 门 的 其 中 一 扁 , 露 出 其 中 一 只 山羊 。 注 意 ,主持 人 清楚 地 知道 , 哪 扁 门 
后 是 山羊 。 主 持 人 其 后 会 问 参 赛 者 要 不 要 改选 另 一 扇 仍然 关 着 的 门 。 问 题 是 : 换 另 一 肩 
门 能 否 增加 参赛 者 赢得 汽车 的 概率 ? 答案 是 会 。 你 能 利用 单 人 博弈 模型 给 出 简单 的 分 
析 吗 ? 

2. 两 人 博弈 

显然 ,两 人 博弈 有 两 个 参与 者 ,他 们 的 策略 和 得 益 是 相互 依存 的 。 前 面 提 到 的 博弈 模 
型 大 多 是 两 人 博弈 ,如 办 徒 困境 ,价格 战 .夫妻 战争 等 。 在 本 书 中 ,我 们 将 大 范围 地 讨论 两 
人 博弈 。 准 确 来 讲 , 本 书 主要 以 两 人 博弈 为 例 介绍 博弈 的 基本 理论 和 方法 。 实 际 上 ,这 些 
理论 可 能 不 限于 两 人 博弈 ,而 是 多 人 博弈 下 的 结果 。 

1944 年 , 冯 “。 诺 依 曼 和 摩根 斯 坦 的 经 典 著作 《博弈 论 与 经 济 行为 ) 将 两 人 博弈 推广 到 
n 人 博弈 结构 ,并 将 博弈 论 系统 应 用 于 经 济 领 域 ,从 而 奠定 了 这 一 学 科 的 基础 和 理论 体 
系 。 约 翰 。 福布斯. 纳什 (John Forbes Nash, Jr. ) 的 开创 性 论文 {n 人 博弈 的 均衡 点 》 
(1950)《 非 合作 博弈 》(1951) 等 ,给 出 了 多 人 纳什 均衡 的 概念 和 均衡 存在 定理 。 因 此 ， 
除非 特别 说 明 , 两 人 博弈 下 的 一 般 性 结论 也 适用 于 多 人 博弈 一 一 当然 ,并 不 能 简单 
照搬 。 

3. 多 人 博弈 

多 人 博弈 是 指 三 个 及 以 上 参与 者 进行 的 博弈 。 在 分 析 参 与 者 的 策略 行为 时 ,不 仅 要 
考虑 两 两 之 间 的 相互 作用 ,还 要 考虑 参与 者 可 能 会 形成 联盟 。 因 此 ,这 种 情况 比 仅 有 两 人 
博弈 时 更 加 复杂 。 此 时 ,决策 者 在 决策 时 是 否 面临 强力 约束 将 直接 引出 博弈 分 析 的 两 种 
思路 : 非 合作 博弈 与 合作 博弈 。 无 论 哪 种 博弈 ,人 们 在 分 析 决 策 者 的 策略 行为 时 都 要 考 
虑 可 能 发 生 的 联盟 对 均衡 策略 的 影响 。 让 我 们 举例 来 说 明 这 一 事实 。 

某 一 公司 有 三 个 股东 X\Y、Z, 分 别 持 有 公司 25%、35%、40% 的 股份 。 现 在 公司 有 四 
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个 项 目 A、B、C.D 可 以 投资 ,但 是 只 能 投资 一 个 项 目 。 股 东 X 的 选择 倾向 是 A、B、C、D， 
即 首 选 是 项 目 A, 再 选 是 项 目 B, 次 选 是 项 目 C, 末 选 是 项 目 D; 股东 Y 的 选择 倾向 是 B、 
C.D、A; 股东 Z 的 选择 倾向 是 D.B、A、C。 图 1-15 股东 首选 ”再 选 ”次 选 ”未 选 
所 示 为 股东 偏好 排序 。 x B c D 

对 于 任 一 股东 ,自己 的 首选 得 到 执行 时 得 益 为 ”vy B C D A 
3, 青 选 得 到 执行 的 得 益 是 2, 次 选 得 到 执行 的 得 益 ”Zz D B A C 
是 1, 未 选 得 到 的 得 益 是 0。 如 果 100 张 选票 按照 
股东 的 股份 进行 分 配 ,那么 股东 X\Y、Z 分 别 得 到 
25 张 .35 张 .40 张 选票 。 股 东 投 票 的 要 求 是 必须 把 自己 的 选票 全 部 投 给 某 一 个 项 目 。 最 
终 得 票数 最 多 的 项 目 将 获得 执行 。 

不 难 理解 ,每 个 股东 都 想 让 自己 的 首选 项 目 得 到 执行 ,这 样 自己 的 得 益 才 能 最 大 化 。 
如 果 如 此 投票 , 则 项 目 A 获得 25 张 选票 ,项目 B 获得 35 张 选票 ,项 目 D 获得 40 张 选票 。 
显然 ,项 目 D 将 会 得 到 执行 。 但 它 会 是 一 个 均衡 吗 ? 事实 上 并 不 是 ,因为 必须 考虑 其 他 
股东 联合 时 的 情况 。 例 如 ,如 果 股 东 X 改 将 选票 投 给 项 目 B, 那 么 项 目 B 就 会 获得 执行 。 
这 时 股东 X 的 得 益 会 变 成 2, 股 东 Y 的 得 益 变 成 3。 显 然 , 它 优 于 上 述 的 诚实 投票 ( 意 即 
股东 们 根据 各 自 的 偏好 投票 ) 。 

这 种 内 部 成 员 为 了 谋取 更 多 利益 而 形成 联盟 的 例子 看 似 虚构 ,实际 上 并 不 少见 ,如 春 
秋末 期 的 “ 晋 阳 之 战 ”。 

在 周 朝 和 春秋 早期 ,各 诸侯 国 通常 都 将 公 室 子孙 分 封 为 大 夫 , 以 血缘 关系 作为 公 室 的 
屏 卫 。 及 至 晋 献公 ,由 于 宠爱 骊 姬 而 破除 了 先例 , 逐 杀 诸 公 子 。 从 此 晋 国 的 公 室 贵族 逐渐 
为 外 姓 “ 权 臣 ? 所 取代 。 从 晋 文公 开始 ,后 经 历代 演变 ,到 春秋 末期 , 晋 国 只 剩 下 智 ., 赵 、 韩 、 
笋 四 家 ,其 中 以 智 氏 最 强 。 

智 氏 之 主 智 伯 在 朝 专权 ,假借 向 晋 公 献 地 进行 “ 削 薄 ”。 韩 康子 、 魏 桓 子 惧 其 以 武力 相 
加 ,被 迫 各 送 一 万 户 之 邑 。 在 向 赵 计 子 索 地 唱 拒 后 , 智 伯 胁 连 韩 、 魏 两 家 出 兵 攻 打 赵 氏 。 
智 伯 围 困 晋 阳 两 年 而 不 能 下 , 引 普 水 海 灌 普 阳 城 。 危 急 中 , 赵 庄子 派 张 孟 谈 说 服 韩 、 魏 两 
家 倒戈 ,放水 倒灌 智 伯 军 营 。 遂 大 破 智 伯 军 , 擒 杀 智 伯 。 晋 阳 之 战 为 日 后 “三 家 分 晋 ” 黄 定 
了 基础 。 

在 “ 晋 阳 之 战 ? 中 , 韩 氏 和 魏 氏 由 于 旦 惧 智 氏 的 强势 而 采取 委 曲 求全 的 策略 ,使 得 他 们 
陷 和 人 了 困境 。 但 是 ,这 种 策略 也 并 非 不 可 取 ,毕竟 反例 为 证 。 赵 氏 的 反抗 引发 了 智 氏 与 韩 
魏 的 联合 攻 战 ,水 混 晋 阳 , 处 境 改 炭 可 危 。 若 不 是 说 服 韩 魏 倒 戈 , 与 赵 氏 形成 三 家 联盟 ,也 
很 难 存活 。 因 此 ,就 独自 决策 而 言 ， 智 伯 索 地 , 韩 . 赵 、 魏 献 地 ”看 似 一 个 "均衡 ”。 但 事实 
证 明 它 不 稳定 ,被 韩 赵 魏 三 家 联盟 打破 了 。 

不 仅 如 此 ,还 有 更 为 令 人 深思 的 现象 。 在 多 人 博弈 中 ,看 似 均 衡 的 背后 常 有 “破坏 者 ” 
存在 。 所 谓 “ 破 坏 者 ”, 就 是 指 这 样 的 一 类 参与 者 : 他 的 策略 选择 对 自身 利益 并 无 太 大 影 
响 ,不 过 对 其 他 参与 者 却 有 着 显著 作用 ,甚至 是 决定 性 的 。 通 俗 来 讲 , 破 坏 者 的 行为 也 许 
并 不 能 使 自己 成 功 , 但 是 却 可 以 阻止 别人 成 功 。 


图 1-15 股东 偏好 排序 
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< 扩展 阅读 : 总 统 候选 中 的 破坏 者 


“破坏 者 ”在 美国 总 统 竞 选中 相当 常见 。 例 如 ,在 2000 年 的 大 选中 拉 尔 夫 。 纳 德 就 是 
所 谓 的 “破坏 者 ”, 类 似 还 有 1992 年 大 选中 的 总 统 候选 人 罗斯 。 佩 罗 (Ross Perot)、1980 
年 大 选中 的 总 统 候选 人 约翰 ， 安德森 (John Anderson) 和 1968 年 大 选中 的 总 统 候选 人 乔 
治 。 华 莱 士 (George Corley Wallace Jr. ) ,等 等 。 

2000 年 ,小 布什 (George Walker Bush) ,六 尔 (Albert Arnold Gore Jr. ) 、 纳 德 (Ralph 
Nader) 三 个 候选 人 参与 竞选 ,票数 最 高 者 选举 为 总 统 。 按 照 当年 的 情景 ,小 布什 和 葬 尔 
在 佛罗里达 州 之 外 的 选票 几乎 相等 。 然 而 ,在 佛罗里达 州 一 直 呈 现 胶着 状态 。 经 过 多 次 

票数 统计 (包括 人 工 普查 ), 葬 尔 最 终 仅 以 537 票 的 差距 输 给 小 布什 。 其 间 , 纳 德 一 直 作 
为 两 大 党 之 外 的 绿 党 参与 总 统 竞选 ,在 佛罗里达 州 赢得 9.7 万 选票 。 其 竞选 纲领 与 民主 
党 比较 接近 ,因此 很 多 民主 党 人 认为 , 纳 德 的 参 选 分 走 了 本 应 投 给 器 尔 的 部 分 选票 。 假 设 
纳 德 退出 竞选 ,那么 将 有 约 5. 2 万 选票 投 给 况 尔 , 匡 尔 就 能 成 功 当选 。 时 至 今日 ,支持 苹 
尔 的 民主 党 人 依旧 认为 当初 是 纳 德 的 “搅局 "让 苞 尔 最 终 以 微弱 差距 败 给 小 布什 的 。 


1.4.2 根据 策略 数量 分 类 


如 果 一 个 策略 式 博弈 中 参与 者 数量 和 所 有 策略 集合 都 是 有 限 的 9 ,那么 该 博弈 是 有 
限 的 ; 反之 ,只 要 参与 者 数量 或 某 一 参与 者 的 策略 集合 是 无 限 的 ,那么 该 博弈 就 是 无 限 
的 。 在 常见 的 有 限 博弈 中 ,每 个 参与 者 的 可 能 策略 总 数 不 过 个 位 数字 ,如 果 仅仅 学 习 博 弈 
知识 ,而 并 非 为 了 解决 某 个 特定 问题 ,2 一 5 个 策略 已 经 足够 说 明 问题 ,就 像 前 述 的 内 徒 困 
境 ,酒吧 问题 一 样 。 在 常见 的 无 限 博弈 中 ,决策 变量 则 表现 为 实数 或 可 列 的 自然 数 。 例 
如 ,石油 输出 国 组 织 COPEC) 的 成 员 国家 之 间 就 石油 输出 所 进行 的 博弈 ,其 中 各 个 国家 的 
石油 产量 可 视 为 某 一 区 间 内 的 实数 。 又 如 , 某 一 市 场 上 寡头 企业 间 就 生产 多 少 产品 所 进 
行 的 博弈 ,产品 产量 可 视 为 可 列 的 自然 数 或 不 可 列 的 实数 。 当 然 , 如 果 参 与 者 的 数量 是 无 
限 的 ,一 般 为 无 限 可 列 的 。 例 如 ,考察 某 一 群体 雄性 体征 的 演化 博弈 ,可 将 雄性 个 体 的 数 
量 视 为 无 限 可 列 的 。 

从 分 析 方 法 上 来 讲 , 有 限 博弈 和 无 限 博弈 存在 较 大 差别 。 如 果 参 与 者 的 策略 集合 是 
有 限 的 ,可 以 采用 穷 举 比较 、 归 纳 迭 代 等 方法 。 如 果 参 与 者 的 策略 集合 是 无 限 的 , 穷 举 法 
显然 失效 ,因而 常常 采用 微 积分 来 分 析 参 与 者 的 最 优 策 略 。 相 较 有 限 博弈 而 言 , 虽 然 对 无 
限 博弈 的 建 模 引 入 了 更 多 的 数学 符号 ,分 析 也 更 加 抽象 ,但 是 只 要 读者 掌握 了 微 积 分 和 概 
率 论 的 基础 知识 ,就 会 发 现 难度 并 没有 显著 增加 。 如 果 参 与 者 的 数量 是 无 限 的 , 则 更 多 地 
使 用 归纳 迭代 或 微分 方程 来 由 特殊 推 及 一 般 , 得 出 具有 普 适 性 的 等 式 关系 。 


1.4.3 ”根据 得 益 状况 分 类 
根据 博弈 中 所 有 参与 者 的 得 益 总 和 ,可 将 博弈 分 为 零 和 博弈 、 常 和 博弈 和 变 和 博弈 。 


中 ”如 果 一 个 策略 集合 所 包含 的 元 素 是 有 限 的 , 则 称 这 个 集合 是 有 限 的 ; 否则 , 称 这 个 集合 是 无 限 的 。 
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所 谓 零 和 博弈 ,是 指 无 论 参与 者 如 何 行动 ,所 有 参与 者 的 得 益 总 和 始终 为 0 的 一 类 博弈 。 
类 似 地 ,无论 参与 者 如 何 行动 ,所 有 参与 者 的 得 益 总 和 始终 为 某 一 常数 的 博弈 称 为 常 和 博 
弈 ， 否则 称 为 变 和 博弈 。 

1. 零 和 博弈 

零 和 博弈 是 常见 的 一 类 博弈 ,也 是 研究 最 早 . 最 多 的 一 类 博弈 。 例 如 ,第 1. 3. 2 节 所 
涉及 的 赌 胜 博 弈 ,大 多 是 有 赢 必 有 输 , 所 有 输家 的 损失 就 是 所 有 赢家 的 所 得 。 就 经 济 生产 
而 言 , 零 和 博弈 并 不 能 给 社会 带 来 增益 或 亏损 ,只 是 财富 或 资源 在 博弈 成 员 内 部 的 重新 分 
配 。 此 外 ,竞技 类 比赛 常常 都 是 零 和 博弈 。 在 这 类 比赛 中 ,参与 者 之 间 的 竞争 通常 都 比较 
激烈 ,利益 是 相互 对 立 的 。 进 而 ,参与 者 也 更 关注 如 何 制 胜 ,几乎 没有 合作 的 空间 一 一 即 
使 有 ,参与 者 之 间 的 合作 也 常常 被 禁止 。 

实际 上 ,在 常见 的 “纳什 均衡 ?出 现 之 前 ,博弈 论 的 研究 主要 集中 在 零 和 博弈 。 从 博弈 
论 的 历史 来 看 , 零 和 博弈 是 最 早 研究 的 一 类 博弈 。 零 和 博弈 在 均衡 解 及 其 存在 性 条 件 等 
方面 都 有 特定 的 性 质 , 在 进行 重复 博弈 时 也 有 一 些 特性 ,这 在 后 面 的 章节 中 将 会 作 相应 
阐释 。 

2. 常 和 博弈 

常 和 博弈 在 本 质 上 与 零 和 博弈 相同 ,可 以 通过 将 所 有 的 得 益 都 减 去 某 一 相同 数值 而 
变 为 零 和 博弈 。 当 然 , 零 和 博弈 也 可 视 为 常 和 博弈 的 一 种 特例 。 

在 常 和 博弈 中 ,参与 者 之 间 的 利益 也 是 相互 对 立 的 ,更 易 引 发 竞争 和 冲突 。 实 际 上 ， 
常 和 博弈 常用 于 分 析 固 定 份额 财富 或 资源 的 分 配 ,如 大 国之 间 就 指定 的 碳 排放 量 的 分 配 、 
子 公司 之 间 的 红利 分 配 等 。 在 积分 制 的 竞技 体育 中 也 常见 这 种 博弈 ,如 排球 比赛 ,获胜 的 
团队 获得 1 分 ,否则 0 分 。 

3. 变 和 博弈 

变 和 博弈 中 参与 者 的 利益 总 和 会 随 着 策略 组 合 的 不 同 而 变化 。 此 时 参与 者 之 间 的 利 
益 既 对 立 又 统一 , 既 不 能 完全 避免 竞争 ,又 有 合作 的 可 能 性 。 在 人 际 互动 中 常见 的 “ 双 
赢 ”, 一 般 出 现在 变 和 博弈 中 。 而 本 书 所 要 讨论 的 博弈 则 大 部 分 属于 变 和 博弈 。 这 类 博弈 
的 应 用 也 很 广泛 。 例 如 ,已 经 提 及 的 囚徒 困境 、 夫 妻 战 争 等 博弈 。 又 如 ,足球 联赛 中 胜 方 
积 3 分 ,平局 各 积 1 分 ; 每 场 比 赛 的 积分 之 和 要 么 为 3 分 ,要 么 为 2 分 。 
1.4.4 根据 行动 次 序 分 类 

从 博弈 的 要 素来 讲 , 接 下 来 我 们 依照 博弈 的 规则 对 其 进行 分 类 。 请 注意 ,规则 包含 多 
个 方面 ,首先 是 行动 次 序 。 现 有 博弈 的 研究 可 依照 行动 次 序 简单 地 分 为 三 类 : 静态 博弈 、 

1. 静态 博弈 

静态 博弈 是 指 博弈 中 的 参与 者 同时 采取 行动 ,或 者 ,虽然 行动 有 先后 次 序 但 是 参与 者 
无 法 看 到 别人 的 行动 。 需 要 说 明 的 是 后 一 种 情况 。 在 有 些 博弈 中 ,虽然 参与 者 并 不 是 同 
时 行动 的 ,但 是 他 们 在 行动 之 前 并 不 知道 其 他 人 会 选择 什么 策略 ,因此 无 法 针对 别人 的 行 
动 做 出 反应 。 即 便 在 行动 期 间 一 方 知道 了 对 方 的 行动 .也 无 法 另行 更 换行 动 。 例 如 ,两 军 
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对 至 ,即便 一 方 在 作战 中 获悉 了 对 方 的 作战 计划 ,可 是 已 经 来 不 及 更 换 自己 的 计划 来 应 
对 。 这 种 情形 在 战争 史上 屡见不鲜 。 例 如 .赤壁 之 战 中 的 火烧 战 船 情节 ,原文 如 下 。 

sse 报 称 :“ 看 插 青 龙 牙 旗 。 内 中 有 大 旗 , 上 书 先 锋 黄 盖 名 字 。” 操 笑 日 :“ 公 鹤 来 降 ， 
此 天 助 我 也 1” 来 船 渐 近 。 程 旦 观望 良久 , 谓 操 日 :“ 来 船 必 诈 。 且 休 教 近 寨 。” 操 日 :“ 何 
以 知之 1” 程 旦 日 :“ 粮 在 船 中 , 船 必 稳重 ; 今 观 来 船 , 轻 而 且 浮 。 更 兼 今夜 东南 风 甚 紧 , 倘 
有 许 谋 ,何以 当 之 ?” 操 省 悟 , 便 问 :“ 谁 去 止 之 ?" 文 聘 日 :“ 某 在 水 上 颇 熟 , 愿 请 一 往 。” 言 
毕 , 跳 下 小 船 ,用 手 一 指 , 十 数 只 巡 船 , 随 文 聘 船 出 。 聘 立 于 船 头 ,大 叫 :“ 丞 相 钧 虽 : 南 船 
且 休 近 寨 ,就 江 心 抛 住 ." 众 军 齐 喝 :“ 快 下 了 篷 !" 言 未 绝 , 刀 弦 响 处 , 文 聘 被 箭 射 中 左 辟 ， 
倒 在 船 中 。 船 上 大 乱 , 各 自 奔 回 。 南 船 距 操 寨 止 隔 二 里 水 面 。 黄 盖 用 刀 一 招 , 前 船 一 齐 发 
火 。 火 趁 风 威 , 风 助 火势 , 船 如 箭 发 , 烟 焰 涨 天 。'…… 

显然 , 孙 曹 两 家 制定 的 战略 (策略 ) 不 是 同步 的 ,也 没有 任何 沟通 ,反而 相互 欺瞒 。 周 
瑜 就 计 用 火 攻 ,曹操 拒 谏 锁 战 船 ; 阅 泽 密 献 诈 降 书 、 孔 明 巧 借 东 南 风 。 这 些 环 环 相 扣 的 事 
件 逐 步 形成 了 双方 的 策略 : 黄 公 材 乘 火 船 诈 降 , 曹 备 德 纳 降 军备 战 。 而 且 , 火 攻 时 的 行动 
也 有 先后 次 序 。 例 如 , 黄 盖 在 出 发 前 早已 自 准 备 火 船 20 只 , 船 头 密布 大 钉 ,而 曹操 在 察觉 
来 船 有 诈 时 已 然 来 不 及 变换 战略 ,只 能 仓促 应 战 。 正 如 前 述 论 断 , 只 要 参与 者 在 行动 之 前 
看 不 到 别人 的 行动 ,而 且 参 与 者 之 间 没有 沟通 ,那么 这 样 的 博弈 都 可 以 忽略 参与 者 的 行动 
次 序 ,而 视 之 为 静态 博弈 。 

2. 动态 博弈 

实际 上 ,并 非 所 有 博弈 中 的 参与 者 都 是 同时 行动 的 或 可 视 作 同时 行动 的 。 相 反 ,存在 
一 大 类 博弈 ,其 中 的 行动 是 有 先后 次 序 的 ,并 且 参 与 者 能 够 观察 到 历史 行动 从 而 做 出 自己 
的 反应 (行动 ) ,这 类 博弈 被 称 为 动态 博弈 。 参 与 者 的 每 次 行动 可 看 作 一 个 阶段 ,因此 , 动 
态 博 弈 也 称 * 多 阶段 博弈 ”。 在 动态 博弈 中 ,常见 的 一 类 博弈 是 弈 棋 游 戏 和 纸牌 游戏 。 在 
这 类 游戏 中 ,规则 明确 规定 每 个 参与 者 的 行动 次 序 ,而且 还 会 涉及 未 被 允许 的 出 牌 ( 棋 ) 。 
当然 ,未 被 允许 的 出 牌 既 有 可 能 是 统一 而 定 的 ,也 有 可 能 是 根据 历史 行动 而 定 的 。 

一 般 而 言 ,先期 行动 不 仅 影响 后 继 行动 所 对 应 的 策略 集合 大 小 ,还 可 能 影响 到 未 来 参 
与 者 的 数量 ,自然 也 会 影响 到 对 后 继 行动 的 最 优选 择 。 例 如 ,在 春秋 战国 时 期 的 长 平 之 战 
中 , 赵 军 数 战 不 利 ,主将 廉 颇 决定 依托 有 利 地 形 ,坚守 不 出 。 秦 国 丞 相 范 瞧 派 人 携带 千金 
到 赵 国 施行 反 间 计 , 赵 孝 成 王 不 顾 获 相 如 和 赵 括 母 亲 的 谏 阻 , 派 赵 括 去 接替 廉 颇 为 主将 。 
显然 , 范 瞧 的 反 间 计 不 仅 改 变 了 廉 颇 和 赵 括 各 自 的 行动 空间 (各 自 的 策略 集合 ) ,而 且 也 将 
廉 颇 从 后 续 博 弈 中 剔除 了 。 

同 静 态 博弈 一 样 ,每 个 参与 者 为 了 寻求 最 佳 策略 都 必须 思考 这 样 的 问题 : 如 果 我 如 
此 选择 ,对方 将 如 何 应 对 ? 对 于 我 的 每 一 个 可 能 行动 ,是 否 他 都 有 应 对 ? 如 果 给 定 他 的 应 
对 ,什么 才 是 我 的 最 优 行动 ? 

2015 年 3 月 ,格力 电器 开始 涉足 手机 行业 。 实 际 上 ,各 大 手机 厂商 也 都 在 紧锣密鼓 
地 推出 自己 的 新 产品 。 例 如 ,3 月 31 日 三 星 S6 正式 发 布 ,4 月 8 日 HTC 发 布 One M9 十 ， 

当 像 格力 电器 这 样 的 家 电厂 商 开 始 进 军 智 能 手机 行业 的 时 候 , 既 有 厂家 应 该 作 何 反 
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应 ?假设 手机 市 场 已 经 接近 饱和 ,格力 的 进入 只 能 是 从 既 有 厂家 口中 分 一 杯 姜 ,因此 可 能 


会 遭 到 既 有 厂家 的 抵制 。 如 此 一 来 ,格力 不 但 不 能 盈 权力 
利 ,反而 还 会 亏损 。 而 其 他 手机 厂商 也 要 因此 而 付出 
代价 。 如 果 其 他 手机 厂商 不 进行 打压 ,那么 格力 就 可 和 i 
以 在 这 里 分 得 一 部 分 利润 。 当 然 格力 也 可 以 选择 不 
进入 市 场 。 格 力 进军 手机 市 场 博弈 如 图 1-16 所 示 。 es ed 


简单 起 见 ,假设 总 利润 为 100. 其 他 既 有 的 手机 厂 
商 就 以 TIME 指 代 。 如 果 格 力 不 进 军 手 机 领域 ,那么 
格力 的 得 益 为 零 。 如 果 格 力 进军 手机 领域 ,那么 
TIME 选择 打压 , 则 TIME 得 益 就 变 为 90 ,而 格力 的 (5o0) (5.95) 
收益 变 为 一 5; 如 果 TIME 选择 不 打压 , 则 两 者 和 平 
相处 ,TIME 的 收益 为 95, 格 力 的 收益 为 5。 这 就 是 两 
个 参与 者 的 两 阶段 博弈 ,是 动态 博弈 的 一 种 简单 情景 ,其 中 格力 的 收益 在 前 ,其 他 企业 是 
收益 在 后 。 

3. 重复 博弈 

除了 静态 博弈 和 动态 博弈 之 外 ,还 存在 一 类 相对 特殊 的 博弈 : 重复 博弈 。 所 谓 重 复 
博弈 ,是 指 同 一 个 博弈 反复 进行 所 构成 的 整体 博弈 过 程 ,而 构成 重复 博弈 的 一 次 性 博弈 叫 
作 “ 元 博弈 "或 者 “阶段 博弈 "。 这 种 博弈 ,简单 来 说 就 是 同一 个 博弈 在 相同 的 环境 条 件 下 
重复 进行 。 例 如 ,剪刀 石头 布 ? 游 戏 , 同 一 个 游戏 会 不 停 地 重复 ;贸易 制裁 与 反 制 裁 , 会 
在 两 个 国家 间 不 定期 上 演 ; 等 等 。 

重复 博弈 又 可 以 分 为 有 限 重复 博弈 和 无 限 重复 博弈 。 有 限 重复 博弈 是 指 原 博弈 在 重 
复 了 有 限 次 后 就 会 结束 的 博弈 。 例 如 ,在 NBA 赛事 体系 中 ,每 个 球员 都 与 老板 签订 了 固 
定期 限 合 同 。 在 每 一 年 的 特定 时 间 ,球员 和 老板 将 就 维持 合同 和 结束 合同 进行 权衡 ,这 就 
是 一 个 有 限 重 复 博弈 。 而 无 限 重复 博弈 是 指 无 限 次 重复 的 博弈 。 一 般 来 讲 , 它 只 是 理论 
意义 上 的 “无 限 ”。 当 一 个 博弈 中 的 参与 者 无 法 预知 博弈 的 结束 时 间或 重复 次 数 时 ,也 可 
视 为 无 限 博弈 。 例 如 ,麦当劳 与 肯德基 ,百事 可 乐 与 可 口 可 乐 等 长 期 竞争 对 手 之 间 的 博 
弈 ,都 可 视 为 无 限 博弈 。 

需要 提醒 读者 注意 的 是 ,一 次 博弈 和 重复 博弈 是 有 显著 差别 的 。 在 一 次 博弈 中 ,由 于 
参与 者 之 间 的 博弈 只 有 一 次 ,参与 者 只 需 顾及 眼前 利益 即 可 。 因 此 ,只 要 有 利 可 图 ,参与 
者 无 须 考虑 公平 与 合作 问题 ,任何 自私 自 利 的 行动 都 可 以 采取 一 一 甚至 可 以 无 情 地 “ 伤 
害 ” 或 者 “出卖 ”对 方 。 但 是 在 重复 博弈 中 参与 者 必须 考虑 后 继 博 弈 的 影响 。 如 果 参 与 者 
因 在 某 一 阶段 选择 了 自私 行为 而 伤害 了 对 方 , 那 么 他 必须 顾忌 在 后 继 阶 段 对 方 报复 的 可 
能 性 与 后 果 。 

所 以 ,在 眼前 利益 与 未 来 利益 的 权衡 下 ,参与 者 有 可 能 采取 合作 行动 。 一 般 来 讲 , 重 
复 的 次 数 越 多 ,合作 的 可 能 性 就 越 大 ; 特别 是 当 重 复 次 数 趋 向 于 无 穷 时 ,博弈 的 结果 还 可 
能 发 生根 本 性 的 变化 。 


图 1-16 格力 进军 手机 市 场 博弈 


1.4.5 根据 参与 者 理性 分 类 


根据 博弈 中 参与 者 的 决策 理性 ,博弈 又 可 以 分 为 合作 博弈 和 非 合作 博弈 两 大 类 .9 
笼统 地 讲 ,合作 博弈 强调 的 是 集体 理性 和 效率 ,参与 者 的 决策 是 以 集体 目标 最 大 化 为 驱动 
的 ; 而 非 合作 博弈 则 更 强调 个 体 理性 , 即 个 体 利益 最 大 化 。 

从 博 穿 论 的 发 展 历史 看 ,合作 博弈 与 非 合作 博弈 是 从 两 个 不 同 的 出 发 点 展开 研究 的 。 
二 者 的 发 端 时 间 几 乎 相同 ,及 至 后 来 .形成 了 相互 独立 的 博弈 理论 和 研究 方法 。 非 合作 博 
弈 强调 的 重点 在 个 人 行为 : 每 个 理性 的 参与 者 会 做 出 什么 样 的 决策 ,理性 的 参与 者 实际 
上 是 怎样 选择 行动 的 ,博弈 最 可 能 出 现 的 结果 是 什么 等 。 但 在 合作 博弈 中 ,人 们 更 关注 参 
与 者 之 间 的 联合 行为 : 他 们 会 形成 什么 样 的 联盟 (甚至 包括 所 有 参与 者 的 大 联盟 ) ,他 们 
之 间 如 何 瓜分 合作 的 收益 等 。 如 果 合 作 确 实 带 来 收益 ,但 是 收益 的 分 配 不 足以 使 所 有 参 
与 者 最 终 接受 ,那么 就 应 假定 存在 一 些 能 使 协议 实施 的 外 在 机 制 ( 如 制度 、 仲 裁 者 等 )。 除 
此 之 外 ,还 有 以 下 两 点 需 进 一 步 说 明 。 

首先 , 非 合作 博弈 并 非 意味 着 每 个 参与 者 总 是 拒绝 合作 ,而 是 强调 参与 者 自私 的 决策 
动机 , 即 决策 时 仅 考虑 自己 的 利益 。 读 者 可 回顾 前 文 所 出 现 的 博弈 案例 , 管 中 宕 豹 。 在 非 
合作 博弈 中 ,除了 那些 博弈 规则 确实 允许 的 协议 外 ,参与 者 们 无 法 达成 有 约束 力 的 协议 ， 
所 以 诸如 协议 ,威胁 ,承诺 之 类 的 沟通 事项 是 无 法 实施 的 一 一 即便 允许 这 类 沟通 存在 , 仍 
然 无 法 确保 它们 是 可 信 的 。 在 非 合 作 博 弈 中 ,与 具体 情形 有 关 的 方方面面 都 必须 明白 无 
误 地 模型 化 在 博弈 规则 中 。 所 以 ,在 非 合 作 博 弈 中 即便 有 合作 出 现 , 它 也 是 以 自 利 为 前 提 
的 ,在 规则 中 有 着 明确 约定 的 。 

当然 ,不 能 据 此 否认 在 非 合 作 博 弈 中 有 合作 行为 出 现 。 事 实 上 , 非 合 作 博 弈 论 中 的 重 
要 工作 之 一 就 是 : 设计 科学 合理 的 激励 机 制 , 促 使 内 生 的 合作 在 一 定 条 件 下 实现 。 

其 次 ,合作 博弈 假定 参与 者 之 间 的 协议 是 有 完全 约束 力 并 且 能 够 实施 的 , 即 合作 是 外 
生 的 。 从 本 质 上 讲 ,合作 博 弈 理论 研究 的 是 如 何在 参与 者 之 间 达 成 一 种 有 约束 力 的 协议 ， 
以 便 形成 一 个 无 冲突 、 无 背叛 的 合作 联盟 (抑或 说 串 谋 )。 不 过 ,从 某 种 意义 上 讲 , 合 作 博 
弈 可 视 作 非 合作 博弈 的 一 种 特例 , 意 即 串 谋 和 约束 过 程 可 以 从 外 部 植 和 博弈 规则 (或 博弈 
的 要 素 ) 中 的 情况 。 


1.4.6 根据 信息 结构 分 类 


第 1.2.2 节 已 经 对 博弈 的 信息 结构 做 了 介绍 ,顺便 提 及 了 依照 信息 结构 所 进行 的 博 
弈 分 类 。 而 本 书 也 正 是 将 信息 结构 与 行动 次 序 相 结合 来 组 织 章节 内 容 的。 具体 而 言 ,本 
书 将 依照 完全 信息 静态 博弈 、 完 全 信息 动态 博弈 完全 但 不 完美 信息 博弈 ,不 完全 信息 静 
态 博弈 和 不 完全 信息 动态 博弈 (后 两 者 并 人 同一 章节 ) 来 讲述 非 合作 博弈 知识 ; 并 在 其 后 
介绍 了 博弈 论 中 相对 独立 的 三 部 分 内 容 : 重复 博弈 .演化 博弈 与 合作 博弈 。 


中 有 些 教材 还 依据 完全 理性 和 有 限 理性 将 博弈 分 为 传统 的 非 合作 博弈 与 演化 博弈 。 实 际 上 ,演化 博弈 的 主体 
内 容 仍 然 是 建立 在 个 体 理性 基础 之 上 的 。 因 此 ,本 书 将 演化 博弈 视 作 非 合 作 博 弈 中 一 个 相对 独立 的 分 支 。 
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博弈 论 的 早期 研究 主要 集中 在 如 何 从 数学 形式 上 解决 诸如 均衡 解 的 定义 等 基础 问题 
上 ,其 应 用 也 大 多 集中 在 政治 .军事 以 及 博彩 等 领域 。 直 到 20 世纪 70 年 代 中 期 以 后 研究 
者 才 开始 转 而 强调 参与 者 的 理性 以 及 与 理性 相关 的 知识 结构 。 特 别 是 在 讨论 了 个 人 的 效 
用 函数 之 后 ,他 们 发 现 信息 是 一 个 非常 重要 的 问题 。 逐 步 地 ,信息 问题 成 了 研究 者 关注 的 
焦点 。 当 然 , 在 此 之 前 ,一 些 葛 基 性 成 果 已 经 出 现 , 只 是 还 未 得 到 广泛 关注 。 同 时 ,一 个 参 
与 者 是 否 具有 足够 的 理性 及 在 这 种 理性 下 他 都 知道 哪些 信息 ,再 到 这 些 信 息 如 何 体现 在 
博弈 模型 中 ,这 些 问题 都 将 深刻 影响 到 参与 者 的 行为 以 及 对 这 些 行 为 的 分 析 。 例 如 ,在 研 
究 个 人 行为 时 ,个 人 决策 有 一 个 时 间 顺 序 , 意 即 当 你 做 出 某 项 决策 时 必须 对 你 之 前 或 之 后 
的 决策 有 所 了 解 ( 哪 怕 只 是 猜想 或 主观 感知 ) 。 毕 竟 , 你 的 决策 受 之 前 行动 的 影响 ,也 将 影 
响 后 续 的 行动 。 因 此 ,时 序 问题 以 及 何 为 共同 知识 就 变 得 非常 重要 。 博 弈 论 发 展 到 这 一 
阶段 正好 为 这 两 方面 的 问题 (时 序 和 信息 ) 提 供 了 有 力 的 分 析 工 具 。 

作为 总 结 ,图 1-17 给 出 了 常见 的 博弈 分 类 。 


单 人 博弈 
mr 人 两 人 博弈 


多 人 博弈 
有 限 博 认 
和 < 
静态 博弈 
次 序 < 动态 博弈 
重复 博弈 


零 和 博弈 
Ms < WN 
变 和 博 认 


博 赛 


合作 博 讲 
atE<C 
韭 合作 博弈 


图 1-17 常见 的 博弈 分 类 


1.5 博弈 论 简 史 


博弈 论 是 一 门 非常 年 轻 并 且 充 满 活力 的 学 科 。 纵 观 博弈 论 的 发 展 进程 及 研究 对 象 ， 
它 是 由 静态 博弈 到 动态 博弈 ,由 完全 信息 博弈 到 不 完全 信息 博弈 ,由 简单 博弈 到 复杂 博弈 
的 一 个 不 断 发 展 的 过 程 。 


1.5.1 博弈 论 的 早期 形成 
尽管 博弈 论 的 朴素 思想 可 以 追溯 到 人 类 的 古代 文明 ,但 是 近 现代 科学 意义 上 的 博弈 
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历史 却 并 没有 那么 远 ,普遍 认为 其 起 源 于 19 世纪 40 年 代 , 成 立 于 20 世纪 40 年 代 , 距 今 
也 不 过 七 八 十 年 的 历史 。 

1838 年 ,安东尼 ， 奥 古 斯 丁 ， 古 诺 (Antoine Augustin Cournot) 提 出 了 关于 行业 窒 
头 之 间 通 过 产量 决策 进行 竞争 的 模型 (常见 的 古 诺 模型 ) ,可 看 作 博 弈 论 早期 研究 的 起 点 。 
1883 年 ,约瑟夫 。 伯 川 德 (Joseph Bertrand) 提 出 了 通过 价格 进行 博弈 的 赛 头 竞争 模型 
〈 伯 川 德 模型 ) ,与 古 诺 模型 有 异曲同工 之 妙 。 当 然 ,弗朗西斯 。 伊 西 德 罗 。 埃 奇 沃 斯 
(Francis Ysidro Edgeworth) 在 1881 年 提出 的 “合同 曲线 ”也 是 博弈 论 发 展 的 思想 源泉 ， 
与 合作 博弈 理论 中 的 “ 核 * 这 一 重要 概念 相 吻 合 。 但 是 .它们 只 能 算 作 早 期 的 零星 研究 ,其 
贡献 主要 在 于 发 展 了 经 济 学 ,而 并 非 试 图 创建 一 个 新 学 科 或 新 理论 。 

直到 20 世纪 初 ,博弈 研究 才 在 理论 基础 上 有 了 较 大 进步 。 厄 恩 斯 特 ， 策 梅 罗 (Ernst 
Friedrich Ferdinand Zermelo) 在 1913 年 得 出 了 关于 象棋 博弈 的 定理 ,并 提出 了 ”逆向 归 
纳 法 ”一 一 它 是 对 动态 博弈 进行 分 析 的 一 个 基本 工具 。 而 在 1921 年 , 埃 米 尔 。 波 莱 尔 
(Emile Borel) 通 过 研究 象棋 对 混合 策略 做 出 了 现代 表述 ,进而 给 出 了 两 人 有 限 博弈 的 极 
小 极 大 解 ; 紧 接着 ,约翰 。 冯 “。 诺 依 曼 于 1928 年 给 出 了 扩展 型 博弈 的 定义 ,并 证 明了 有 
限 策略 二 人 零 和 博弈 具有 确定 性 结果 。 这 在 博弈 论 的 发 展 中 意义 重大 ,相当 于 宣告 了 这 
条 道路 可 行 。 而 真正 意义 上 的 博弈 论 诞生 始 于 冯 ，。 诺 依 曼 与 奥斯卡 ， 摩 根 斯 坦 在 其 后 出 
版 的 专著 。 

汉 。 诺 依 曼 和 摩根 斯 坦 于 1944 年 合 著 的 (博弈 论 与 经 济 行为 ), 标 志 着 博弈 论 作为 一 
门 独立 学 科 的 诞生 。 该 巨著 汇集 了 当时 博弈 论 的 研究 成 果 , 将 其 框架 首次 完整 而 清晰 地 
表述 出 来 ,使 其 作为 一 门 学 科 获 得 了 应 有 的 地 位 。 在 书 中 ,作者 引入 了 通用 博弈 理论 的 思 
想 , 提 出 了 大 部 分 经 济 问题 都 应 作为 博弈 来 分 析 。 具 体 而 言 , 该 书 介 绍 了 博弈 的 扩展 式 和 
标准 式 ( 亦 称 策略 式 ) ,定义 了 最 小 最 大 解 ,并 证 明了 这 个 解 在 所 有 二 人 零 和 博弈 中 存在 
( 非 合作 博弈 ) 。 同 时 ,他们 也 对 合作 博弈 做 了 探讨 ,开辟 了 一 些 新 的 研究 领域 。 在 这 部 著 
作 中 ,作者 使 用 了 包括 集合 论 线性 集合 .逻辑 学 和 群 论 等 一 些 重要 概念 来 益 述 博弈 的 相 
关 概 念 和 结论 。 严 密 的 数学 演绎 虽然 看 似 艰 涩 抽象 ,但 却 为 博弈 论 的 稳健 发 展 提供 了 坚 

20 世纪 五 六 十 年 代 是 博弈 论 研究 发展 的 重要 阶段 。 合 作 博 弈 与 非 合作 博 弈 同时 发 
展 , 各 有 千秋 。 同 时 ,后 来 所 形成 的 其 他 博弈 论 分 支 也 基本 都 在 此 时 发 端 。 

首先 ,在 非 合 作 博 弈 方面 ,纳什 在 1950 年 和 1951 年 发 表 了 两 篇 关于 非 合 作 博 弈 的 重 
要 论文 ,明确 提出 了 “纳什 均衡 "的 概念 。 纳 什 均衡 要 求 每 个 参与 者 的 策略 是 对 他 所 预测 
的 对 手 策略 的 最 优 反 应 ,并 且 可 使 每 个 参与 者 的 预测 都 是 正确 的 。“ 纳 什 均衡 "这 一 概念 ， 
黄 定 了 非 合作 博弈 的 蓬勃 发 展 。 同 时 , 它 也 是 古 诺 和 伯 川 德 所 研究 的 特定 模型 均衡 的 一 
个 自然 推广 ,是 大 多 经 济 问题 分 析 的 起 点 。1950 年 ,美国 数学 家 艾 伯 特 。 塔 克 (Albert 
Tucker) 与 人 合作 建立 了 “ 因 徒 困境 "模型 .对 博弈 问题 进行 了 形象 化 的 处 理 和 表述 ,使 其 
广 为 接受 。 

但 是 , 彼 时 的 博弈 论 研究 仍然 处 于 萌芽 状态 。 在 1956 年 耶路撒冷 举行 第 一 届 国 际 博 
弈 论 会 议 时 ,与 会 者 仍然 少 得 可 怜 一 一 直到 20 世纪 60 年 代 取 得 了 一 些 重 大 进展 。 


34 博弈 论 入 门 


1965 年 ,莱茵 哈 德 。 泽 尔 腾 (Reinhard Selten) 引 入 了 “ 子 博弈 完美 纳什 均衡 "。 他 最 
先 论证 了 在 一 般 的 动态 博弈 中 , 某 些 纳什 均衡 比 其 他 的 纳什 均衡 更 加 合理 ,这 就 是 子 博弈 
完美 均衡 。 它 要 求 均衡 策略 在 每 个 信息 集 上 都 是 对 于 对 手 策略 的 最 佳 反 应 ,这 样 就 避免 
了 局 中 人 利用 非 最 优 策略 来 实施 “空洞 威胁 ”或 “ 信 口 承 诺 ”。 子 博弈 完美 纳什 均衡 是 纳什 
均衡 在 完全 信息 动态 博弈 中 的 精练 与 推广 。 

尽管 如 此 , 仍 有 大 片 空白 等 待 着 研究 者 们 去 开垦 。 例 如 ,决策 缺乏 足够 信息 的 情况 比 
比 皆 是 。 由 于 缺乏 处 理 不 完全 信息 的 一 般 性 手段 ,所 以 博弈 论 的 早期 研究 相对 迟缓 ,批评 
声 不 断 。 直 到 1967 年 .1968 年 ,约翰 。 海 萨 尼 (John C. Harsanyi) 提 出 一 种 转换 方法 来 
模型 化 不 完全 信息 博弈 ,这 种 局 面 才 得 以 改善 。 这 种 方法 也 被 称 作 海 萨 尼 转 换 , 它 将 无 从 
分 析 的 不 完全 信息 转化 为 可 利用 贝 叶 斯 方法 来 分 析 的 完全 但 不 完美 信息 。 这 种 转换 带 来 
了 贝 叶 斯 理论 的 广泛 使 用 ,因而 也 使 得 贝 叶 斯 纳什 均衡 具有 了 非常 强 的 解释 力 。 从 此 , 博 
弈 论 也 成 为 研究 信息 问题 的 重要 手段 ,促进 了 信息 经 济 学 的 发 展 。 

其 次 ,对 博弈 中 合作 行为 的 研究 。1953 年 ,罗伯特 ， 吉 利 斯 (Robert P. Gillles) 提 出 
了 合作 博弈 中 核 的 概念 ,后 经 劳 埃 德 。 夏 普 利 (Lloyd Shapley) 和 马丁 ， 舒 贝克 (Martin 
Shubik) 发 展 成 为 合作 博弈 解 的 概念 。 同 样 在 1953 年 ,夏普 利 运用 公理 化 方法 建立 了 夏 
普 利 值 。 夏 普 利 值 强调 所 得 与 贡献 对 等 ,是 合作 博弈 中 关于 利益 分 配 的 一 个 重要 概念 。 
此 后 ,罗伯特 。 约翰 。 奥 曼 (Robert John Aumann) 考 察 了 许多 具体 的 合作 行为 ,分 析 了 
更 特殊 的 合作 行为 的 解 ( 核 ), 并 于 1959 年 定义 了 ”* 强 均衡 ”的 概念 , 即 没 有 任何 行为 人 和 群 
体 可 以 通过 单方 面 改变 他 们 的 决策 来 获 益 的 情形 。1964 年 奥 曼 和 迈克 尔 ， 梅 斯 勒 
(Michael Maschler) 引 入 合作 博弈 的 谈判 集 ,1965 年 莫 顿 。 戴 维 斯 (Morton D. Davis) 和 
梅 斯 勒 建立 了 核 ,1969 年 大 卫 ， 施 梅 德 勒 (David Schmeidler) 建 立 了 核 仁 。 

同时 ,在 20 世纪 50 年 代 后 期 的 核武 器 军备 竞赛 背景 下 ,托马斯 ， 谢 林 (Thomas C. 
Schelling) 在 其 《冲突 的 策略 》(1960) 一 书 中 ,提出 了 将 博弈 论 作 为 社会 科学 研究 统一 框架 
的 观点 ,并 对 讨价还价 和 冲突 管理 做 了 详尽 分 析 。 他 把 注意 力 从 零 和 博弈 上 转移 开 来 ,并 
强调 这 样 一 个 事实 : 几乎 所 有 的 多 人 决策 问题 都 是 冲突 和 共同 利益 的 混合 体 ,并 且 两 种 
利害 关系 之 间 的 相互 作用 可 以 通过 非 合 作 博 弈 理论 进行 分 析 。 他 的 工作 是 把 博弈 论 带 和 人 
社会 科学 的 里 程 碑 。 

最 后 ,博弈 论 中 还 有 两 个 重要 的 分 支 : 微分 博弈 和 演化 博弈 。 

(1) 微分 博弈 的 提出 最 初 是 出 于 军事 上 的 需要 。 在 对 航天 技术 中 的 制导 系统 、 拦 截 
飞行 器 以 及 有 关机 动 追 击 等 军事 问题 的 研究 中 ,采用 既 有 的 博弈 理论 难以 奏效 。 因 而 从 
1951 年 开始 ,以 美国 数学 家 鲁 弗 斯 。 伊 萨 克 (Rufus Issacs) 为 首 的 研究 小 组 ,将 现代 控制 
论 中 的 一 些 模式 引入 博弈 论 , 取 得 了 突破 性 的 进展 ,并 开创 了 新 的 对 策 论 研究 领域 一 一 微 
分 对 策 。1965 年 伊 萨 克 发 表 《 微 分 博弈 ,这 是 一 部 经 典 之 作 , 它 与 理 查 德 。 贝尔 曼 
(Richard Bareman) 1957 年 发 表 的 《动态 规划 》 列 夫 。 庞 德里 亚 金 (Lev Semionovich 
Pontryagin)1962 年 发 表 的 《最 优 过 程 的 数学 理论 ?共同 奠定 了 确定 性 微分 博弈 的 理论 
基础 。 

(2) 1950 年 ,阿曼 。 阿 尔 钦 (Armen Albert Alchian) 建 议 在 经 济 分 析 中 用 “自然 选 
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择 ” 的 概念 代 蔡 “ 利 润 最 大 化 ”, 认 为 适度 的 竞争 可 以 作为 决定 各 种 制度 形式 存在 的 动态 选 
择机 制 。 在 这 种 选择 机 制 下 ,即使 不 把 行为 主体 看 作 是 理性 的 ,但 来 自 社会 的 演化 压力 也 
将 促使 每 个 行为 主体 采取 最 适合 自身 生存 的 行动 ,从 而 达到 一 种 均衡 。 阿 尔 钦 的 这 种 演 
化 观 不 仅 为 新 制度 经 济 学 研究 制度 的 选择 提供 了 一 个 思路 ,而 且 也 为 演化 博弈 论 的 发 展 
提供 了 思路 。 纳 什 1950 年 的 “群体 行为 解释 ”, 则 认为 是 包含 较 完整 的 演化 博 穿 思想 的 最 
早 理 论 成 果 。 纳 什 认为 ,不 需要 假设 参加 者 有 关于 总 体 博弈 结构 的 充分 知识 ,也 不 要 求 参 
加 者 有 进行 任何 复杂 推理 的 愿望 和 能 力 ,只 需 假定 参加 者 能 够 积累 关于 各 种 纯 策略 被 采 
用 时 的 相对 优势 的 实证 信息 ,纳什 均衡 仍 可 达到 。 此 后 这 方面 研究 几乎 沉寂 ,直至 20 世 
纪 70 年 代 演 化 博弈 才 有 重要 的 进展 。 

20 世纪 五 六 十 年 代 是 博弈 论 发 展 的 重要 时 期 ,一 系列 兼 具 一 致 预测 性 和 普遍 适用 人 性 
的 基本 概念 得 到 了 系统 阐述 与 港 清 , 而 诸如 不 完全 信息 与 非 转 移 效用 联盟 博弈 这 样 的 扩 
充 使 理论 变 得 更 具 广 泛 应 用 性 。 博 弈 论 的 快速 发 展 和 早期 两 大 主要 阵营 一 一 兰 德 公司 和 
普 利 斯 顿 大 学 对 人 才 的 积极 吸纳 分 不 开 。 实 际 上 ,博弈 论 初期 的 研究 队伍 很 弱小 。 直 至 
70 年 代 , 研 究 者 才 逐 渐 壮 大 ,1972 年 第 四 届 国 际 博弈 论 会 议 的 参加 者 已 有 近 百 人 之 多 。 


1.5.2 博弈 论 的 成 长 壮大 


20 世纪 七 八 十 年 代 是 博弈 论 的 成 长 壮大 期 。 经 济 研 究 中 的 绝 大 多 数 应 用 模型 都 是 
在 70 年 代 中 期 后 发 展 起 来 的 。 从 80 年 代 开 始 ,博弈 论 逐 渐 成 为 主流 经 济 学 的 一 部 分 ,其 
至 可 以 说 成 为 了 微观 经 济 学 的 基础 。 各 种 权威 经 济 学 期 刊 均 以 不 断 增长 的 篇 幅 刊载 博弈 
论 的 研究 论文 ; 重要 的 博弈 论 研 究 中 心 也 开始 在 美国 ,德国 法国、 荷兰 .日 本 .英国 .印度 
等 国家 建立 起 来 。 这 段 时 期 内 ,博弈 论 在 所 有 研究 领域 都 得 到 了 重大 突破 ,同时 它 也 开始 
对 其 他 学 科 的 研究 提供 思想 源泉 和 分 析 工 具 。 在 理论 上 ,博弈 论 从 基本 概念 到 理论 推演 
均 形 成 了 一 个 完整 且 内 容 丰 富 的 体系 。 在 应 用 上 ,政治 与 经 济 模型 有 了 深入 研究 , 非 合作 
博弈 理论 应 用 到 大 批 特殊 的 经 济 模型 。 同 时 博弈 论 也 应 用 到 生物 学 、 计 算 机 科学 ,道德 哲 
学 等 领域 ,诸如 混合 策略 这 样 的 概念 又 得 到 了 重新 解释 。 

1972 年 ,Tnternational Journal of Game Theory 创刊 ,而 其 他 一 些 博弈 理论 刊物 也 
相继 出 现 。1973 年 , 海 萨 尼 提 出 了 关于 “混合 策略 ”的 不 完全 信息 解释 ,以 及 “严格 纳什 均 
衡 " 的 概念 。 同 年 ,迈克 尔 ， 斯 宾 塞 (A. Michael Spence) 提 出 了 信号 博弈 ,目前 已 成 为 信 
息 不 对 称 研究 中 的 一 个 重要 部 分 。 他 在 研究 中 不 仅 开创 了 广泛 运用 扩展 式 博弈 描述 经 济 
问题 的 先河 ,而 且 还 较 旱地 给 出 了 完美 贝 叶 斯 均衡 等 概念 。 

1975 年 , 泽 尔 腾 借 用 策略 式 博弈 提出 了 闸 拌 手 均衡 的 概念 。 在 均衡 精练 中 这 一 概念 
占据 着 重要 地 位 ,开启 了 一 种 全 新 的 思路 。 同 时 , 它 也 是 一 种 很 强 的 精练 均衡 ,因此 又 简 
称 完美 均衡 。 其 基本 思想 是 : 在 任何 一 个 博弈 中 ,每 一 个 局 中 人 均 有 可 能 犯错 误 ,但 是 微 
小 的 错误 不 会 改变 参与 者 对 某 些 均衡 的 预测 ,这 如 同 双 手 颤 拌 的 老人 与 人 握手 时 的 情形 。 
如 此 一 来 ,局 中 人 在 选择 策略 时 就 要 考虑 到 其 他 局 中 人 犯错 误 的 可 能 性 ,由 此 定义 更 加 合 
理 的 均衡 。 

及 至 20 世纪 80 年 代 , 用 于 消除 动态 不 完全 信息 中 “空调 威胁 ”或 “ 信 口 承诺 ”的 多 个 
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精练 均衡 概念 已 经 相继 建立 。 除 了 上 述 的 闸 拌 手 均衡 外 , 序 贯 均衡 也 于 1982 年 最 早 提出 
并 发 展 成 为 博弈 中 最 一 般 的 均衡 概念 。 序 贯 均衡 是 非 完 全 信息 动态 博弈 中 的 核心 概念 ， 
是 对 完美 贝 叶 斯 均衡 的 再 精练 ,也 是 信息 经 济 学 的 分 析 基 础 ; 而 完美 贝 叶 斯 均衡 则 可 理 
解 为 贝 叶 斯 纳什 均衡 和 子 博 弈 完美 纳什 均衡 的 综合 。 

20 世纪 80 年 代 涌 现 了 一 批 有 重要 影响 的 研究 者 ,如 戴 维 ， 克 雷 普 斯 (David M. 
Kreps) ,保罗 ， 米 格 罗 姆 (Paul Milgrom) 、 罗 伯 特 ， 威尔逊 (Robert Wilson) 乔治， 阿 克 
罗 夫 (George A. Akerlof) ,迈克尔 。 斯 宾 塞 (A. Miehael Spence) 和 约瑟夫 。 尤 金 斯 带 
格 利 茨 (Joseph Eugene Stiglitz) 等 。 这 些 人 对 于 不 完全 信息 博弈 中 的 机 制 设计 和 信息 不 
对 称 的 研究 ,奠定 了 相当 长 时 期 内 博弈 论 研究 和 应 用 的 格局 。 

此 外 ,1976 年 奥 曼 对 “共同 知识 ”的 讨论 也 引发 了 关注 。 奥 曼 通 过 研究 建立 了 所 谓 的 
“交互 认识 论 ”, 从 而 形成 了 现 有 关于 参与 者 可 理性 化 以 及 共同 知识 的 广泛 认同 。 同 时 , 交 
互 认识 论 也 在 经 济 模型 和 计算 科学 等 许多 领域 得 到 了 广泛 应 用 ,比如 用 于 分 析 多 重 处 理 
器 网 络 的 分 布 环 境 等 。 

在 合作 博弈 方面 ,1974 年 吉 列 尔 莫 。 欧 文 (Guillermo Owen) 提 出 欧文 值 ,1977 年 罗 
杰 ， 梅 尔 森 (Roger B. Myerson) 提 出 梅 尔 森 值 等 作为 合作 博弈 的 解 。 

在 微分 博弈 方面 ,美国 数学 家 艾 夫 纳 。 弗 里 德 曼 (A. Friedman) 于 1971 年 确立 了 微 
分 博弈 的 理论 基础 ,使 微分 博弈 渐 趋 系统 和 完善 。 他 采用 离散 近似 序列 方法 建立 微分 博 
弈 值 与 鞍点 存在 性 理论 ,这 给 微分 博弈 商定 了 坚实 的 数学 理论 基础 。 作 为 一 种 有 效 的 方 
法 ,微分 博弈 被 广泛 应 用 于 分 析 对 抗 问题 ,尤其 在 军事 对 抗 领域 。 今 天 ,微分 博弈 的 应 用 
已 经 深入 到 社会 经济. 生活 等 各 个 领域 的 方方面面 ,比如 生产 与 投资 .劳资 与 谈判 .招标 
与 投标 等 。 

在 20 世纪 70 年 代 博 弈 论 发 展 的 重要 事件 中 ,还 应 当 提 及 * 演 化 博弈 论 "。 尽 管 在 早 
期 的 研究 中 也 涉及 演化 思想 ,但 是 演化 博弈 理论 能 够 在 各 个 不 同 的 领域 得 到 极 大 的 发 展 
应 归功 于 约 输 ， 梅 纳 德 。 史密斯 (John Maynard Smith) 与 乔治 。 罗 伯 特 ， 普 瑞 斯 
(George R. Price) ,他 们 提出 了 演化 博弈 理论 中 的 基本 概念 一 一 演化 稳定 策略 (ESS) 。 史 
密斯 和 普 瑞 斯 的 工作 把 人 们 的 注意 力 从 博弈 论 的 理性 陷阱 中 解脱 出 来 , 换 另 一 个 角度 为 
博弈 理论 的 研究 寻找 到 可 能 的 突破 口 。 自 此 以 后 ,演化 博弈 论 迅 速 发 展 起 来 。 生 态 学 家 
泰勒 (P. D. Taylor) 和 琼 克 (L. Jonker) 在 1978 年 考察 生态 演化 现象 时 首次 提出 了 演化 博 
弈 理论 的 基本 动态 概念 一 一 复制 者 动态 ,这 是 演化 博弈 理论 的 又 一 次 突破 性 发 展 。 演 化 
稳定 策略 与 复制 者 动态 一 起 构成 了 演化 博弈 理论 最 核心 的 一 对 基本 概念 ,它们 分 别 表征 
演化 博弈 的 稳定 状态 和 向 这 种 稳定 状态 的 动态 收敛 过 程 , 演 化 稳定 策略 概念 的 拓展 和 动 
态 化 构成 了 演化 博弈 论 发 展 的 主要 内 容 。 


1.5.3 博弈 论 的 逐渐 成 熟 


1994 年 ,纳什 、 泽 尔 腾 和 海 萨 尼 三 位 博弈 论 学 者 荣获 诺 贝 尔 经 济 学 奖 ,为 博弈 论 树 起 
了 一 块 不 朽 的 科学 丰碑 。 此 后 ,博弈 论 的 研究 和 应 用 受到 世界 各 国 的 重视 ,而 这 一 领域 的 
诺 贝 尔 经 济 学 奖 也 频频 出 现 。 随 着 技术 的 发 展 ,数值 计算 、 数 据 分 析 与 计算 机 模拟 已 经 不 
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再 是 博弈 论 发 展 中 的 显要 障碍 ,这 极 大 地 推动 了 博弈 论 的 发 展 。 而 要 对 每 年 所 发 表 的 有 
关 博 弈 论 数 以 千 计 的 文献 进行 了 解 已 不 是 件 容 易 的 事 。 至 今 , 博 弈 论 仍 在 不 断 发 展 与 


深化 。 


20 世纪 90 年 代 之 后 ,博弈 论 已 经 变 得 非常 庞大 , 枝 繁 叶 茂 。 平 铺 直 叙 已 经 无 法 完整 
精确 地 描述 博弈 论 发 展 的 历史 。 因 此 ,我 们 只 是 摘录 硕果 ,管窥 一 斑 。 表 1-2 列 出 了 与 博 
弈 论 相 关 的 诺 贝尔 经 济 学 奖 获得 者 的 工作 ,也 是 近期 研究 的 主线 。 
表 1-2 诺 贝尔 奖 获得 者 及 其 所 做 的 贡献 


获奖 


获奖 时 


年 份 获得 者 (国家 ) 主要 贡献 所 在 机 构 所 属 领 域 
约翰 ， 海 萨 尼 美国 加 州 
四 ee 这 三 位 数学 家 在 非 合作 博弈 的 均衡 分 析 一 | 
1994 理论 方面 做 出 了 开创 性 的 贡献 ,对 博弈 i 博弈 论 
John Forbes Nash,Jr. 论 和 经 济 学 产生 了 重大 影响 斯 顿 大 学 
莱 因 哈 德 。 泽 尔 腾 德国 波恩 
Reinhard Selten 大 学 
詹姆斯 .英里 斯 前 者 在 信息 经 济 学 理论 领域 做 出 了 重大 | 英国 剑桥 
1996 James A. Mirrlees 贡献 ,尤其 是 不 对 称 信息 条 件 下 的 经 济 大 学 信息 
威廉 ， 维 克 里 激励 理论 ; 后 者 在 信息 经 济 学 .激励 理 | 美国 哥 伦 经 济 学 
William Vickrey 论 ,博弈 论 等 方面 都 做 出 了 重大 贡献 比 亚 大 学 
乔治 ， 阿 克 洛 夫 美国 加 州 
George A. Akerlof 为 不 对 称 信息 市 场 的 一 般 理论 葛 定 了 基 大 学 
Zai 迈克 尔 。 斯 宾 塞 石 , 他 们 的 理论 迅速 得 到 了 应 用 ,从 传统 | 美国 斯 坦 信息 
A. Michael Spence 的 农业 市 场 到 现代 的 金融 市 场 ,他 们 的 福 大 学 经 济 学 
约瑟夫 。 尤 爹 。 斯 带 格 利 茨 | 贡献 来 自 现代 信息 经 济 学 的 核心 部 分 美国 哥 伦 
Joseph Eugene Stiglitz 比 亚 大 学 
罗伯特 。 奥 曼 以 色 列 希 
od Robert J. Aumann 通过 博弈 论 分 析 促 进 了 对 冲突 与 合作 的 | 伯 来 大 学 博弈 论 
托马斯 。 谢 林 理解 美国 马里 
Thomas C. Schelling 兰 大 学 
里 奥 尼 德 。 赫 维 蒋 美国 明 尼 
Leonid Hurwicz 苏 达 大 学 
埃 里 克 。 马 斯 金 PUN 美国 普林斯顿 。 微观 
Ce 高 等 研究 院 | 经 济 学 
罗 杰 。 梅 尔 森 美国 世 
Roger B. Myerson 加 哥 大 学 
埃 尔 文 。 罗 斯 Ea 
Alvin E. Roth 创建 “稳定 分 配 "的 理论 ,并 进行 “市 场 设 天 四 只 化 大 学 人 
罗 伊 德 。 夏普 利 计 ” 的 实践 美国 加 州 大 学 
Lloyd S. Shapley 
让 “。 梯 若 尔 i 法 国 图 卢 规制 
0 Jean Tirole 对 市 场 力量 和 管制 的 研究 分 析 兹 经 济 学 院 经 济 学 
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在 诺 贝尔 经 济 学 奖 中 ,与 博弈 论 相关 的 获奖 者 数目 几乎 是 最 多 的 。1994 年 ,由 于 在 
非 合作 博弈 研究 方面 的 卓越 成 就 ,纳什 ( 美 ) 、 海 萨 尼 ( 美 ) 、 泽 尔 腾 ( 德 ) 三 人 获得 诺 贝尔 奖 。 
1996 年 ,詹姆斯 。 莫 里 斯 (James A. Mirrlees)( 英 ) 和 威廉 。 维 克 瑞 (William Vickrey) (加 
美 ) 在 不 对 称 信息 激励 理论 的 研究 方面 获得 诺 贝尔 奖 。2001 年 ,阿尔 克 洛 夫 ( 商 品 市 场 )、 
斯 宾 塞 (教育 市 场 )、 斯 蒂 格 利 茨 (保险 市 场 )( 美 ) 在 不 完全 信息 市 场 博弈 研究 方面 获得 诺 
贝尔 奖 。2005 年 , 奥 曼 (以 美 ) .托马斯 。 谢 林 (Thomas CSchelling)( 美 ) 在 博弈 论 之 于 
冲突 与 合作 研究 方面 获得 诺 贝 尔 奖 。2007 年 , 埃 里 克 。 马 斯 金 (Eric S，Maskin) 、 梅 尔 
森 、. 里 奥 尼 德 。 赫 维 蒋 (Leonid Hurwicz)( 美 ) 在 博弈 论 与 机 制 设计 研究 方面 获得 诺 贝 尔 
奖 。2012 年 ,罗斯 (Alvin E. Roth) 和 夏普 利 (Lloyd S. Shapley) 因 为 其 在 稳定 匹配 和 与 之 
相关 的 市 场 设计 方面 所 取得 的 成 果 而 获得 诺 贝 尔 奖 。2014 年 ,让 ，。 梯 若 尔 ( 法 国 ) 获 得 诺 
贝尔 奖 ,获奖 原因 是 他 在 分 析 大 型 企业 .市场 力量 与 监管 方面 的 贡献 。 更 多 细致 的 内 容 可 
参阅 相关 资料 。 


1.5.4 ”博弈 论 在 中 国 


中 国 博弈 论 的 研究 起 步 于 20 世纪 50 年 代 吴 文俊 院士 的 工作 , 它 是 吴 文 俊 理 解 博 穿 
论 的 切入 点 ,也 是 他 研究 的 出 发 点 。1959 年 初 , 吴 文俊 发 表 了 他 的 个 人 博弈 论 研究 生涯 ， 
也 是 中 国 博弈 论 研 究 历史 上 的 第 一 篇 论文 。 吴 文俊 很 早 就 意识 到 约翰 。 纳 什 在 50 年 代 
从 事 的 非 合 作 博 弈 研究 的 重要 性 ,在 此 基础 上 发 表 了 两 篇 有 关 非 合作 博弈 的 论文 。 尼 十 
拉 。… 沃 比 约 夫 (Nicola Vobiyov) 教 授 是 苏联 博弈 论 的 奠基 人 ,他 对 于 中 国 博弈 论 的 诞生 
和 成 长 也 曾 做 出 重要 贡献 ,50 年 代 他 应 中 国 科学 院 的 邀请 来 华 讲授 博弈 论 , 受 到 周恩来 
总 理 的 亲切 接见 ,帮助 中 国 培养 了 第 一 代 博 弈 论 领域 的 研究 生 。 

20 世纪 60 年 代 初 到 70 年 代 末 ,由 于 政治 原因 ,中 国 博弈 论 的 研究 处 于 停滞 状态 ,这 
个 时 间 恰 好 是 国际 博弈 论 迅速 发 展 的 关键 时 期 , 非 合 作 均 衡 理 论 体系 逐渐 完善 ,并 在 经 济 
学 中 发 挥 了 至 关 重 要 的 作用 ,合作 博弈 理论 体系 迅速 形成 。 

20 世纪 八 九 十 年 代 , 中 国 博弈 论 的 研究 进入 复苏 阶段 ,不 过 有 关 论 著 并 不 丰富 , 张 维 
迎 的 4 博弈 论 与 信息 经 济 学 ) 对 于 博弈 论 在 中 国 的 经 济 、 金 融和 管理 科学 领域 的 应 用 产生 
了 重要 而 积极 的 影响 。 

21 世纪 的 前 10 年 ,中 国 的 博弈 论 研究 领域 呈现 出 繁荣 景象 ,陆续 出 现 了 适应 不 同 层 
面 需求 的 论著 。 例 如 , 俞 建 的 (博弈 论 与 非 线 性 分 析 》, 高 红 伟 和 彼得 罗 相 的 《动态 合作 博 
弈 } 等 。2004 年 国际 动态 博弈 学 会 中 国 分 会 成 立 ,2005 年 中 国运 筹 学 会 对 策 论 专业 委员 
会 成 立 ,在 国际 上 ,有 中 国学 者 担任 国际 动态 博弈 学 会 执行 理事 等 重要 职位 。 学 术 交 流 日 
趋 活 路 ,在 国内 外 特别 是 周边 国家 和 地 区 的 影响 力 逐 渐 显 现 , 本 领域 的 海外 华人 学 者 对 于 
国内 举办 的 学 术 交流 活动 的 支持 和 响应 程度 逐渐 增强 。2002 年 “国际 数学 家 大 会 “对 策 
论 及 其 应 用 ”卫星 会 议 " 在 青岛 大 学 召开 ,纳什 、 泽 尔 滕 、 奥 曼 以 及 夏普 利 4 位 诺 贝 尔 经 济 
学 奖 得 主 同 时 出 席 会 议 。 自 2004 年 起 ,中 国运 筹 学 会 对 策 论 专 业 委员 会 已 相继 成 功 主持 
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举办 五 届 学 术 年 会 “中 国 博弈 论 及 其 应 用 国际 学 术 会 议 "。 此 外 ,2006 年 协助 组 织 举办 了 
“第 三 届 泛 太平 洋 博 弈 论 大 会 .2010 年 全 国 博弈 论 与 实验 经 济 学 研究 会 在 北京 成 立 并 举 
办 了 “首届 中 国 博弈 论 与 实验 经 济 学 学 会 年 会 ”。 

在 未 来 的 一 段 时 间 内 ,博弈 论 学 科 将 在 进一步 完善 基础 理论 体系 的 基础 上 ,在 应 用 层 
面 取得 多 样 性 .实质 性 的 进展 ; 博弈 理论 与 其 他 多 学 科 理 论 的 交叉 或 结合 将 产生 新 的 研 
究 分 支 ,如 博弈 理论 与 心理 学 、 管 理学 ,金融 学 、 社 会 学 等 学 科 的 交叉 结合 ; 同时 ,有 限 理 
性 ,行为 假设 以 及 在 此 基础 上 所 进行 的 仿真 及 实验 研究 ,也 是 未 来 发 展 的 重要 部 分 。 从 有 
限 理性 假设 ,行为 视角 以 及 复杂 性 科学 出 发 ,并 与 其 他 学 科 有 机 结合 ,运用 实验 研究 现代 
仿真 技术 等 手段 与 方法 ,研究 行为 主体 之 间 的 交互 作用 、 交 互 影 响 的 特征 和 机 理 、 合 作 的 
演化 及 其 规律 ,将 成 为 博弈 科学 研究 的 一 个 重要 发 展 趋势 。 


从 小 玩 到 大 的 “剪刀 石头 布 " 有 何 取胜 之 道 ? 如 何 才能 让 对 手 猜 不 透 ? 如 何 预测 对 手 
的 行动 并 形成 自己 的 策略 ? 这 些 都 是 初学 者 所 关心 的 问题 ,将 在 本 章 逐 一 登场 。 

著名 的 经 济 学 家 保罗 。 萨 绿 尔 森 (Paul A. Samuelson) 有 和 名 名 言 : 你 甚至 可 以 使 一 
只 鹦 殉 变 成 一 个 训练 有 素 的 经 济 学 家 ,因为 它 必须 学 习 的 只 有 两 个 词 , 那 就 是 “供给 ”和 
“需求 "。 就 这 身 名 言 , 著 名 学 者 神 取 道 宏 (Kandori Michihiro) 曾 做 过 一 个 引申 : 现在 这 
只 鹦 鹊 需要 再 学 一 个 词 , 那 就 是 “纳什 均衡 ”。 

姓 庸 置疑 ,纳什 均衡 改变 了 经 济 学 的 语言 和 表达 方法 。 它 是 本 章 的 一 个 重要 概念 ,将 被 重 
点 阐述 。 此 外 ,本 章 还 将 介绍 与 静态 博弈 有 关 的 基础 知识 \ 基 本 分 析 方 法 和 其 他 均衡 概念 等 。 


在 网 上 流传 着 这 样 一 个 故事 。 一 个 古董 商 发 现 一 个 人 用 珍贵 的 茶 碟 装 猫 食 , 于 是 假 
装 对 他 的 猫 非常 喜爱 , 想 从 他 手 里 买 下 这 只 猫 。 猫 主人 一 口 回绝 。 为 此 古董 商 狠 心 出 了 
高 价 , 才 说 服 猫 主人 成 交 。 成 交 后 ,古董 商 装 作 不 经 意 地 说 :“ 这 个 碟子 它 用 习惯 了 ,就 一 
块 儿 送 我 吧 。” 猫 主人 微微 一 笑 :“ 你 知道 用 这 个 碟子 ,我 卖 了 多 少 猫 吗 ?” 

在 这 个 故事 中 ,古董 商 掌握 着 “ 茶 碟 是 古董 ”这 个 信息 ,非常 得 意 , 并 自作 聪明 地 认为 
养 猫 人 不 知道 。 谁 知 猫 主人 不 但 知道 ,而 且 还 利用 了 古董 商 " 认 为 自己 不 知道 ”的 错误 认 
识 , 更 胜 一 筹 。 在 现实 生活 中 也 常 出 现 类 似 的 情境 , 亦 即 参与 者 之 间 并 不 是 相互 知 根 知 底 
的 。 但是, 正如“ 知己知彼 , 百 战 不 殖 ” 所 言 , 一 个 人 对 信息 的 掌握 在 很 大 程度 上 将 会 影响 
他 的 决策 和 结果 。 一 般 而 言 ,拥有 的 信息 越 多 ,正确 决策 的 可 能 性 越 大 。 因 此 ,博弈 的 参 
与 者 会 想 尽 办 法 收集 信息 ,使 自己 的 信息 尽 可 能 完备 。 换 言 之 ,参与 者 希望 将 不 完全 信息 
的 博弈 尽 可 能 完备 化 。 因 此 ,本 书 将 遵照 由 简 入 繁 的 原则 , 紧 接 “ 导 论 ”, 介 绍 完全 信息 下 
的 静态 博弈 。 回 顾 第 1 章 内 容 ,不 难 给 完全 信息 静态 博弈 下 一 个 初步 的 定义 。 

定义 2. 1( 完 全 信息 静态 博弈 的 初步 定义 ) ”完全 信息 指 的 是 所 有 参与 者 清楚 地 了 解 
与 博弈 有 关 的 所 有 信息 。 静 态 是 指 博 弈 的 参与 者 同时 行动 ,或 在 行动 时 不 知晓 对 方 的 行 
动 。 同 时 满足 完全 信息 和 静态 这 两 个 条 件 的 博弈 即 完全 信息 静态 博弈 。 


2.1 常见 的 概念 和 方法 
2.1.1 概念 和 表示 


二 引 语 故事 : (洛杉矶 时 报 ) 大 楼 爆炸 案 的 侦破 
《洛杉矶 时 报 ) 大 楼 爆炸 案 是 发 生 在 美国 洛杉矶 市 的 一 起 有 预谋 爆炸 案 , 时 间 是 1910 
40 
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年 10 月 1 日 凌晨 1 时 07 分 。 炸 弹 炸 毁 了 建筑 的 一 边 ,但 是 引发 的 大 火 却 摊 毁 了 时 报 大 
楼 和 隔壁 报纸 印刷 部 门 所 在 的 建筑 。 当 时 一 群 正 在 连夜 加 班 的 时 报 员 工 仍 在 大 楼 里 。 爆 
炸 引 起 的 火灾 造成 了 21 名 雇员 死亡 ,超过 100 人 受伤 。 事 件 被 (洛杉矶 时 报 ) 称 为 “世纪 
犯罪 ”。 

当局 雇用 的 私家 侦探 W.J. Burns 获知 钢铁 工人 工会 成 员 O. McManigal 和 J.B. 
McNamara 参与 了 爆炸 事件 。McManigal 和 McNamara 都 喜欢 饮酒 和 打猎 ,二 人 常常 一 
起 打猎 。1911 年 4 月 14 日 ,Burns 和 警察 前 往 底 特 律 牛 津 酒店 逮捕 了 O. McManigal 和 
J.B. McNamara, 并 将 他 们 扣押 在 芝加哥 警 长 的 私人 住宅 里 。Burns 一 直 在 努力 说 服 
McManigal, 让 他 以 为 Burns 已 经 知道 一 切 , 而 且 Burns 可 通过 与 当局 交易 来 保全 自己 。 
直到 20 日 ,McManigal 同意 说 出 他 所 知道 的 一 切 来 换取 一 个 较 轻 的 刑期 ,并 签署 了 一 份 
直接 涉及 J. B. McNamara 的 兄弟 J.J. McNamara、 钢 铁 工 人 工会 主席 Ryan 和 其 他 领导 的 
认罪 书 。4 月 26 日 ,McManigal 和 McNamara 兄弟 被 警察 带 回 洛杉矶 。 

McManigal 作为 污点 证 人 当时 并 未 被 起 诉 。McNamara 兄弟 于 1911 年 5 月 5 日 被 
提审 ,他 们 做 了 无 罪 答 辩 。 但 是 12 月 1 日 ,McNamara 兄弟 转 而 改 在 公开 法 庭 上 认罪 。 
同一 时 期 , 另 有 55 名 钢铁 工人 工会 的 成 员 和 官员 被 供出 而 遭 到 逮捕 与 指控 。 另 一 位 关键 
人 物 Hockin 也 通过 指证 他 的 同事 来 避免 自己 坐牢 。 最 终 共 有 38 人 被 定罪 。 

一 一 摘自 (维基 百科 : 洛杉矶 时 报 大 楼 爆炸 案 》 


《洛杉矶 时 报 ) 爆 炸 案 的 侦破 过 程 在 现实 中 很 常见 。 警 察 并 非 对 嫌犯 所 有 的 犯罪 事实 
都 一 清二 楚 ,在 很 大 程度 上 需要 嫌犯 自己 招供 。 因 此 ,嫌犯 往往 在 "坦白 从 宽 ”" 和 "抗拒 从 
严 "之 间 左 右 为 难 。 特 别 是 在 多 人 共同 作案 时 ,一 人 所 极力 保守 的 秘密 却 被 同伙 泄露 得 点 
滴 不 剩 ,这 样 势必 会 给 自己 带 来 抗拒 从 严 ” 的 不 利 后 果 。 然 而 “坦白 从 宽 " 并 非 唯一 的 最 
优选 择 。 假 设 大 家 都 保持 沉默 ,也 许 处 罚 是 最 低 的 。 因 此 ,多 人 同时 被 审讯 时 的 处 境 不 同 
于 一 人 被 审 ,原因 在 于 多 人 之 间 的 互动 作用 会 令 嫌 犯 陷入 一 种 困境 ,这 就 是 博弈 论 中 常见 
的 “囚徒 困 境 ”。 

让 我 们 从 办 徒 困境 开始 ,介绍 完全 信息 条 件 下 的 静态 博弈 。 假 设 甲 乙 两 个 人 一 起 携 
带 炸 药 准备 到 一 处 作案 ,被 警察 发 现 并 抓 了 起 来 。 警 方 怀 疑 这 两 个 人 还 犯 有 其 他 重罪 ,但 
没有 证 据 。 于 是 ,警方 将 他 们 分 别 关押 并 单独 审讯 ,告诉 他 们 : 如 果 不 配合 审讯 拒绝 坦白 
的 话 ,一 旦 你 的 同伙 招供 ,你 将 受到 严惩 。 如 果 你 们 俩 都 坦白 一 一 我 们 按 罪 量刑 ,但 肯定 
比 一 人 顽抗 到 底 要 轻 。 在 这 种 情况 下 ,两 个 嫌犯 都 必须 独立 做 出 抉择 : 坦白 交代 ,或 者 保 
持 沉默 。 于 是 会 出 现 以 下 几 种 情况 。 

(1) 两 人 都 不 坦白 : 警察 以 非法 携带 枪支 罪 将 两 人 各 判 两 年 有 期 徒刑 。 

(2) 其 中 一 人 坦白 而 另 一 人 拒绝 坦白 ,坦白 者 作为 污点 证 人 将 不 会 被 起 诉 , 另 一 人 将 
因 罪 被 重 判 9 年 。 

(3) 如 果 两 人 都 坦白 , 则 双方 都 会 因 罪 各 判 6 年 。 

两 个 嫌犯 该 如 何 抉择 ? 彼此 信任 还 是 互相 背叛 ? 从 表面 上 看 ,他 们 当然 应 该 合作 。 
这 样 两 人 都 只 判 两 年 。 但 是 两 个 嫌犯 都 很 聪明 ,他 们 仔细 审视 了 自身 的 处 境 , 发 现 并 非 
如 此 。 
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甲 心 想 : 假如 乙 不 招供 ,我 也 不 招 的 话 判 两 年 ; 但 我 要 是 坦白 ,马上 就 可 以 获得 自 
由 ,显然 坦白 比较 好 。 假 如 乙 坦白 ,我 若是 不 招 ,就 要 坐 9 年 牢 , 而 招 了 只 坐 6 年 牢 , 同 样 
也 是 坦白 比较 好 。 无 论 乙 如 何 选择 ,自己 都 是 坦白 的 好 。 

同样 , 乙 也 认识 到 了 这 些 , 得 出 了 相同 的 结论 一 一 应 该 坦白 。 

如 此 一 来 ,结局 是 双方 都 坦白 ! 聪明 的 嫌犯 反而 得 不 到 最 好 的 结果 。 

这 就 是 办 徒 困 境 , 它 由 梅里 尔 。 弗 勒 德 (Merrill Flood) 和 梅 尔 文 。 德 雷 硕 尔 (Melvin 
Dresher) 于 1950 年 提出 ,后 来 被 艾 伯 特 。 塔 克 以 办 徒 的 方式 阐述 出 来 。 为 了 用 博弈 论 的 
语言 来 描述 它 ,首先 需要 明确 博 穿 的 三 要 素 , 亦 即 参与 者 、 每 个 参与 者 的 策略 集 0, 以 及 每 
个 参与 者 在 不 同 策略 下 所 对 应 的 得 益 。 

参与 者 : 嫌犯 甲 和 嫌犯 乙 。 

策略 集 : 每 个 参与 者 可 选择 的 只 有 “坦白 "策略 和 “沉默 "策略 ,所 以 ,他 们 的 策略 集 都 
是 {坦白 ,沉默 }。 

得 益 : 意 即 博弈 结束 后 ,参与 者 可 得 到 的 回报 。 办 徒 困 境 中 ,双方 得 到 的 回报 由 双方 
所 选 策略 决定 。 例 如 , 当 办 徒 甲 选择 “坦白 ”而 因 徒 乙 选择 “沉默 ”时 ,内 徒 甲 的 得 益 为 0， 
办 徒 乙 的 得 益 为 一 9。 

上 述 三 点 对 于 两 个 参与 者 而 言 是 共同 知识 。 同 时 ,两 个 参与 者 是 理性 的 ,将 选取 能 够 
最 大 化 自己 利益 的 策略 。 厘 清 三 要 素 之 后 ,可 用 博弈 的 语言 重 述 完全 信息 静态 博弈 。 

定义 2. 2( 完 全 信息 静态 博弈 的 严格 定义 ) 每 一 参与 者 都 拥有 其 他 所 有 参与 者 的 特 
征 、 策 略 集 和 得 益 函 数 等 方面 的 准确 信息 ,这 样 的 博弈 称 为 完全 信息 博弈 。 参 与 考 同 时 行 
动 , 或 者 非 同时 行动 但 后 行动 者 观察 不 到 先行 动 者 的 选择 的 博弈 , 称 为 静态 博弈 。 同 时 满 
足 完全 信息 和 静态 两 个 条 件 的 博弈 称 为 完全 信息 静态 博弈 。 


< 全 tie 六 定义 2.2 中 的 名 语 委 六 


(1) 参与 者 的 特征 指 什么 ? 答 : 特征 很 难 精 准 定 义 , 可 理解 为 "性格"。 在 因 徒 困境 
中 ,参与 者 的 特征 是 理性 (采取 使 自己 收益 最 大 的 策略 )。 在 将 来 的 例子 中 ,我 们 可 能 会 看 
到 有 些 不 理性 (或 称 有 限 理性 ) 甚 至 完全 不 理性 的 参与 者 ,还 会 遇 到 独特 的 性 格 ,比如 “好 
斗 ” 或 “保守 ”。 

(2) 何谓 拥有 得 益 函 数 的 准确 信息 ? 答 :“ 准 确 ”" 一 词 描述 了 两 个 要 点 : 四 收益 函数 
是 确定 的 。 即 每 个 参与 者 在 每 一 种 情况 下 的 得 益 是 一 个 确定 的 值 。 回 收益 函数 是 公共 信 
息 。 例 如 ,在 因 徒 困境 中 无 论 双 方 做 出 什么 选择 ,对 应 选择 下 两 人 的 结果 是 确定 的 ,而 且 
双方 都 清楚 地 知道 ,在 这 种 情况 下 自己 的 结果 和 对 方 的 结果 ,如 甲 知道 自己 坦白 并 且 乙 沉 
默 的 情况 下 ,自己 的 结果 为 获得 自由 ,对 方 的 结果 是 9 年 的 徒刑 。 乙 在 相同 的 情况 下 即 甲 
坦白 而 自己 沉默 时 自己 的 结果 是 9 年 的 徒刑 ,而 对 方 获得 自由 。 


可 用 图 2-1 所 示 的 内 徒 困境 得 益 矩 阵 来 直观 描述 这 个 博弈 。 这 样 的 得 益 矩 阵 将 元 长 


中 策略 集 亦 称 策略 集合 。 有 的 书 也 将 其 称 作 ”策略 空间 ,将 策略 组 合 称 作 ”策略 向 量 ”, 将 得 益 的 组 合 称 作 * 得 
益 向 量 ”"。 本 书 统一 采用 “策略 集 " 和 “策略 组 合 "的 说 法 。 
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的 叙述 化 成 精简 的 表格 和 数字 ,可 使 读者 一 目 了 然 。 那 么 ,什么 样 的 博弈 可 以 用 得 益 和 矩阵 
来 描述 呢 ? 
参与 者 


嫌犯 乙 的 
se 可 选 策略 
RAR 
嫌犯 甲 沉默 坦白 
沉默 -2 ,二 -9,0 
坦白 0, -9 -6， 和 全、 
嫌犯 甲 的 嫌犯 甲 的 嫌犯 乙 的 
可 选 策略 得 益 在 前 得 益 在 后 


图 2-1 “囚徒 困境 "得 益 矩 阵 


首先 ,参与 者 应 该 是 有 限 的 ,两 人 参与 的 博弈 表示 起 来 最 为 方便 。 可 以 想象 若 有 三 个 
参与 者 , 则 需 画 出 一 个 三 维 的 “得 益 矩 阵 ”。 若 有 更 多 的 参与 者 , 则 无 法 画 出 得 益 和 矩阵 了 。 

其 次 ,每 个 参与 者 的 策略 集 也 应 该 是 有 限 集 , 意 即 策略 集合 中 的 所 有 可 能 策略 数目 有 限 。 

最 后 ,由 于 表格 的 局 限 性 ,在 记录 双方 的 一 次 性 行动 时 很 方便 ,但 更 多 的 行动 将 会 带 
来 不 小 的 麻烦 。 读 者 不 妨 亲 自 尝 试 一 下 。 因 此 , 它 在 处 理 静态 博弈 和 仅 有 一 步 的 动态 博 
弈 时 比较 方便 ,但 在 考察 参与 者 的 多 步 动态 行动 时 将 会 丢失 很 多 信息 。 


2.1.2 常见 的 分 析 方 法 


在 囚徒 困境 中 ,“ 双 方 都 坦白 "是 这 场 博弈 极为 可 能 出 现 的 结果 ,而 且 这 一 结果 非常 
“稳定 ”: 假如 任何 一 个 人 单方 面 地 改变 自己 的 选择 ,将 会 得 到 更 差 的 结果 。 所 以 没有 人 
单方 面 更 改 策略 ,双方 处 于 一 种 胶着 的 状态 , 即 均衡 状态 。 那 么 ,应 该 如 何 分 析 并 求 得 这 
些 均衡 呢 ? 分 析 方 法 不 同 会 导致 均衡 结果 不 同 吗 ? 本 小 节 将 介绍 4 种 主要 的 分 析 方法 。 

1. 上 策 均 衡 法 

今 不 劳 兵 马 , 坐 观 成 败 , 斗 两 彪 而 收 长 久之 利 , 上 策 也 。 

一 一 《 魏 书 。 鹤 浩 传 》 

假如 不 论 其 他 参与 者 选择 何 种 策略 , 某 一 个 参与 者 的 某 种 策略 给 他 带 来 的 得 益 总 能 
严格 高 于 其 他 任何 可 选 策略 ,我 们 称 这 样 的 策略 为 该 参与 者 的 一 个 “上策 ”。 

例如 光 内 徒 困境 ?中 的 "坦白 ”策略 一 一 若 选择 "坦白 ”无 论 对 方 选择 “沉默 还是“ 坦 
白 ”, 自 己 的 得 益 都 不 会 少 于 自己 任何 其 他 选择 (“沉默 ”策略 ) 带 来 的 得 益 。 所 以 “坦白 ” 
是 一 个 “上 策 ”。 

更 进一步 ,如 果 在 博弈 中 每 个 参与 者 都 有 上 策 , 这 些 上 策 所 构成 的 策略 组 合 必然 会 受 
到 所 有 参与 者 的 欢迎 。 我 们 称 这 样 的 策略 组 合 为 该 博弈 的 一 个 上 策 均衡 ”。 “囚徒 困 境 ” 
中 的 策略 组 合 (坦白 ,坦白 ) 对 双方 而 言 都 是 上 策 , 所 以 它 是 一 个 上策 均 衡 ”。 可 以 预见 ， 
由 于 所 有 参与 者 都 严格 偏好 “上策 均 衡 ”, 不 会 有 人 主动 偏离 “上策 均衡 ”, 所 以 “上 策 均衡 ” 
是 一 个 稳定 的 均衡 。 一 般 来 讲 , 上 策 均 衡 法 是 双方 都 能 一 致 预测 得 到 的 均衡 。 因 此 称 " 上 
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策 均衡 "具有 良好 的 预测 一 致 性 。 

利用 上 策 均衡 法 进行 分 析 , 能 使 我 们 找 出 所 有 参与 者 的 绝对 偏好 ,因而 得 到 的 结果 也 
非常 稳定 。 所 以 ,上 策 均衡 法 能 对 博弈 结果 做 出 最 肯定 的 预测 。 可 以 说 ,只 要 能 找到 上 策 
均衡 ,对 这 个 博弈 的 分 析 任 务 就 基本 完成 了 。 所 以 在 开始 对 一 个 博弈 进行 分 析 时 ,不妨 先 
看 看 各 个 参与 者 是 否 都 有 上 策 。 如 果 有 ,再 看 看 上 策 均 衡 是 否 存 在 。 

但 事情 并 不 总 会 这 样 顺 利 : 参与 者 有 上 策 的 情况 很 少 ,每 个 参与 者 都 有 上 策 的 情况 
更 加 不 常见 。 现 实 中 人 们 常 遇 到 的 情形 反而 是 所 有 参与 者 都 没有 上 策 。 例 如 ,在 “剪刀 石 
头 布 ” 博 穿 中 每 个 博 穿 者 都 没有 上 策 。 

从 这 一 点 可 以 看 出 ,上 策 均 衡 虽 然 具 有 很 好 的 预测 一 致 性 ,但 是 并 不 具有 普遍 的 适用 
性 。 它 只 在 分 析 少 数 情况 下 的 博弈 时 才能 奏效 。 

2. 严格 下 策反 复 消去 法 

当 你 把 不 可 能 的 因素 全 部 剔除 之 后 ,不 管 剩 下 的 是 什么 ,不 管 它 多 么 令 人 难以 置 
信 一 一 都 是 真相 ! 


一 -福尔摩斯 ( 血 字 的 研究 》 

既然 不 是 所 有 博弈 中 都 存在 备 受 欢迎 的 上策", 那么 让 我 们 换个 思维 方式 ,看 看 是 否 
存在 没 人 喜欢 的 “下 策 ”。 比 较 “ 因 徒 困 境 " 中 两 个 嫌犯 ,无 论 对 手 的 策略 如 何 ,“ 沉 默 ”都 不 
如 “坦白 ”。 此 时 称 “ 沉 默 " 是 相对 于 “坦白 ”的 “严格 下 策 ”。 

推 而 广 之 ,如 果 一 个 参与 者 的 某 个 策略 给 他 带 来 的 得 益 总 是 比 另 一 种 策略 所 带 来 的 
得 益 少 一 一 不 管 其 他 参与 者 的 策略 如 何 变化 都 是 如 此 , 则 称 前 者 为 相对 于 后 者 的 “严格 下 
策 "。 举 个 例子 ,假如 参与 者 ;有 三 个 可 选 策略 “A”“B”“C”, 假 设 不 论 对 方 选 择 何 种 策略 ， 
和 A 策略 带 来 的 得 益 比 B 策略 带 来 的 少 , B 策 略 带 来 的 得 益 比 C 策略 带 来 的 少 。 那 么 尽管 
B 策略 带 来 的 得 益 比 A 策略 多 ,但 B 策 略 依然 是 相对 于 C 策略 的 严格 下 策 ; 同时 A 策略 
是 关于 B 策 略 和 C 策 略 的 严格 下 策 。 

将 这 种 方法 应 用 在 “囚徒 困 境 " 中 : 用 直线 划 去 严格 下 策 , 将 其 剔除 。 结 果 如 图 2-2 
所 示 。 


囚徒 2 
沉默 坦白 
办 徒 1 沉默 -2 -2 9,0 
坦白 0.1-9 -6, -6 


图 2-2 “囚徒 困境 "得 益 矩 阵 画 线 后 结果 


首先 删除 办 徒 1 的 下 策 :“ 沉 默 ”。 然 后 重复 这 个 过 程 , 删 除 办 徒 2 的 下 策 :“ 沉 默 ”。 
此 时 两 个 内 徒 都 不 再 有 严格 下 策 。 一 般 而 言 , 可 重复 剔除 所 有 的 下 策 ,直到 所 有 参与 者 都 
没有 下 策 为 止 。 假 如 此 时 只 剩 下 一 个 策略 组 合 , 则 这 个 策略 组 合 即 为 重复 剔除 严格 下 策 
后 所 得 到 的 均衡 。 例 如 ,囚徒 困境 ?中 (坦白 ,坦白 ) 就 是 博弈 的 均衡 。 这 种 方法 称 为 “ 严 
格 下 策反 复 消去 法 ”。 
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这 种 方法 的 局 限 性 也 很 明显 ,假如 在 重复 剔除 严格 下 策 后 仍然 剩 下 多 个 策略 组 合 , 则 
无 法 确定 谁 是 均衡 的 。 

3. 画 线 法 

参与 者 博弈 的 动机 是 自身 利益 的 最 大 化 。 循 着 这 个 思路 , 若 给 定 其 他 人 的 策略 ,比较 
某 一 参与 者 所 有 可 能 策略 的 对 应 得 益 ,将 得 益 最 大 者 画 线 。 若 对 每 个 参与 者 都 如 此 操作 ， 
则 所 有 得 益 都 被 画 线 的 得 益 组 合 就 代表 所 有 参与 者 的 利益 都 实现 了 最 大 化 。 此 时 的 策略 
组 合 是 双方 都 愿意 的 选择 ,因此 它 是 博弈 的 均衡 。 

先 来 看 一 个 抽象 的 例子 2。 稍 加 观察 可 以 发 现 , 这 个 博弈 中 没有 任何 一 方 拥 有 “严格 
下 策 ”。 如 图 2-3 所 示 。 


参与 者 2 
左 中 右 
上 0 ,4 4.0 553 
参与 者 | ”中 4,0 0,4 Siv 河 
下 k | 6,6 
图 2-3 抽象 博弈 


设想 你 是 参与 者 1, 要 应 对 参与 者 2 的 策略 来 使 自己 的 得 益 最 大 化 。 逐 个 分 析 对 手 
可 能 的 选择 。 

首先 ,假设 对 手 选 “ 左 ”。 通 过 比较 第 一 列 中 前 一 个 数字 (图 2-4 中 被 框 出 的 数字 ) 的 
大 小 ,可 知 应 选择 "中 ”( 因 为 4 之 3 二 0) ,于 是 在 “4” 下 方面 一 条 线 。 如 图 2-4 所 示 。 


参与 者 2 
左 中 右 


(ss 0|, 4 4,0 Su3 
参与 者 | 中 4|,0 0,4 $3 
F ,5 3,.5 6,.6 


图 2-4 抽象 博弈 的 画 线 法 分 析 步 骤 一 
同 理 , 当 对 方 选择 “中 ”时 ,参与 者 1 应 选择 "上 ”。 如 图 2-5 所 示 。 


参与 者 2 
左 中 右 
E 0 ，4 0 Ss 巷 
参与 者 1 中 4.0 4 -| 
F 和 5 6 ,6 


图 2-5 抽象 博弈 的 画 线 法 分 析 步 骤 二 


四 ”本 书 中 大 多 数 例子 都 是 具有 实际 意义 的 博弈 ,不 仅 是 因为 这 些 例子 更 有 趣味 ,还 因为 实践 常 是 解释 理论 的 好 
方式 。 但 是 为 了 更 清楚 地 说 明 问题 ,在 解释 某 些 基本 理论 时 我 们 也 会 选择 一 些 没有 实际 意义 的 抽象 例子 。 
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当 对 方 选择 * 右 ?时 ,参与 者 1 应 选择 “下 ”。 如 图 2-6 所 示 。 


参与 者 2 
左 中 
上 0.4 4,0 
参与 者 1 中 450 0 ,4 
下 人 Se 


图 2-6 抽象 博弈 的 画 线 法 分 析 步骤 三 


现在 换 一 下 身份 ,设想 你 是 参与 者 2。 当 对 方 (参与 者 1) 选 择 " 上 ?时 ,你 应 选择 “ 左 ” 
(因为 4 盖 3 二 0) 。 如 图 2-7 所 示 。 


参与 者 2 
左 中 右 
: "加 : 回 :日 
参与 者 1 中 4,0 0，4 3 
F jm EW 6.56 


图 2-7 ”抽象 博弈 的 画 线 法 分 析 步 又 四 
当 对 方 选择 策略 “中 ”时 ,参与 者 2 也 应 选择 策略 "中 ”。 如 图 2-8 所 示 。 


参与 者 2 
左 中 右 
长 0 ，4 4 ,0 | 
参与 者 ! 中 4 加 | 0 加 | 5 加 | 
F 3,.5 3,.5 ie 


图 2-8 ”抽象 博弈 的 画 线 法 分 析 步 又 五 


当 对 方 选择 “下 ”时 ,参与 者 2 应 选择 策略 “ 右 ”。 如 图 2-9 所 示 。 


参与 者 2 
左 中 右 


上 0，4 4 ,0 [可 要 | 
参与 者 1 中 4.0 0.4 


图 2-9 抽象 博弈 的 画 线 法 分 析 步 又 六 


le 4 
加 


根据 之 前 的 分 析 和 画 线 的 标准 ,可 知 : 得 益 下 方面 线 表示 该 策略 可 能 被 选 ; 策略 组 
合 对 应 的 所 有 得 益 都 被 画 线 说 明 所 有 参与 者 都 有 动机 选择 各 自 的 对 应 策略 ,如 图 2-10 
所 示 。 
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参与 者 2 
左 中 右 
| 0,.4 4,0 $3 
参与 者 1 中 4 ,0 0 ,4 人， 


和 


图 2-10 抽象 博弈 的 画 线 法 分 析 结果 


显然 ,策略 组 合 ( 下 , 右 ) 的 下 方 均 被 画 线 ,因此 是 该 博弈 的 均衡 。 
下 面 用 画 线 法 分 析 “ 因 徒 困境 "作为 巩固 练习 ,步骤 如 图 2-11 一 图 2-15 所 示 。 


办 能 乙 办 徒 乙 

沉默 坦白 沉 虚 坦白 

沉默 ,二 -9 ,0 沉默 -2 ,二 -9|. 0 

因 徒 四 因 徒 四 
坦白 , -9 -6 ,-6 坦白 0 ,-9 eol 
图 2-11 囚徒 困境 的 画 线 法 分 析 步 又 一 图 2-12 囚徒 困境 的 画 线 法 分 析 步 又 二 

囚徒 乙 囚徒 乙 

沉默 坦白 沉默 坦白 


沉默 和 2 六 沉默 -2 ,-2 -9 ,0 
囚徒 甲 囚徒 甲 , 
坦白 0 ,-9 6 坦白 0 ， 6 .4 


图 2-13 “囚徒 困境 ”的 画 线 法 分 析 步骤 三 图 2-14 “囚徒 困境 ”的 画 线 法 分 析 步 骤 四 
因 徒 乙 
沉默 坦白 
沉默 -2 ,-2 -9 ,0 
因 徒 甲 


TY 
坦白 0i 
图 2-15 “囚徒 困境 "的 画 线 法 分 析 结果 


可 知 ,( 坦 白 , 坦 白 ) 是 该 博弈 的 均衡 。 

4. 箭头 法 

在 画 线 法 中 ,参与 者 因 对 某 种 策略 组 合 所 带 来 的 得 益 “ 满 意 ”, 从 而 做 出 选择 。 那 么 反 
过 来 说 ,参与 者 对 某 些 策略 组 合 的 “不 满 ” 会 让 他 们 主动 避 开 。 换 言 之 ,参与 者 总 倾向 于 摆 
脱 令 人 ”不 满 ” 的 策略 组 合 ,以 达成 新 的 能 让 其 满意 的 “策略 组 合 "。 这 种 趋 利 避 害 的 过 程 
实际 上 也 对 应 着 一 种 动态 分 析 方法 。 箭 头 法 就 是 其 中 之 一 。 

仍 以 "囚徒 困境 为 例 。 首 先 , 随 机 从 得 益 矩 阵 中 选择 一 个 策略 组 合 , 作 为 起 点 开始 推 
理 。 这 里 以 (沉默 ,沉默 ) 为 例 。 对 因 徒 甲 而 言 .既然 对 方 选择 “沉默 ”, 自己 如 果 改 变 策略 ， 
即 达 成 策略 组 合 ( 坦 白 ,沉默 ) ,得 益 可 以 更 高 (0 二 一 2)。 于 是 用 一 个 从 (沉默 ,沉默 ) 指 向 
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(坦白 ,沉默 ) 的 竖 向 箭头 来 表示 甲 的 这 种 倾向 。 同 样 , 对 内 徒 乙 而 言 ,他 也 有 动机 改变 自 
己 的 策略 ,于 是 画 一 个 横向 箭头 由 (沉默 ,沉默 ) 指 向 (沉默 ,坦白 )。 如 图 2-16 所 示 。 


囚徒 乙 
沉默 坦白 
沉默 加 一 
办 徒 四 则 ”加 
坦白 0O.-9 | 


图 2-16 “囚徒 困境 ”的 箭头 法 分 析 步骤 一 
跟随 箭头 继续 用 同样 的 方法 分 析 下 一 个 策略 组 合 ( 坦 白 , 沉 默 ) 。 如 图 2-17 所 示 。 
因 徒 乙 


沉默 -2 ,-2 = 
囚徒 甲 | 
坦白 


图 2-17 “囚徒 困境 "的 箭头 法 分 析 步 又 二 
同 理 ,分 析 另 一 个 有 箭头 的 策略 组 合 (沉默 ,坦白 )。 如 图 2-18 所 示 。 


囚徒 乙 
沉默 坦白 
沉默 -2 ，-2 有 到 | >0 
囚徒 甲 
坦白 0 ,-9 国 >-6 


图 2-18 “囚徒 困境 "的 箭头 法 分 析 步 骤 三 


重复 上 述 步 骤 , 若 出 现 只 有 箭头 指 人 ,没有 箭头 指出 的 策略 组 合 , 则 它 就 是 博弈 的 一 
个 均衡 。 如 图 2-19 所 示 。 


囚徒 乙 
沉默 坦白 


沉默 5 | i 时, 


四 徒 甲 i eT 
图 2-19 “囚徒 困境 ”的 箭头 法 分 析 结果 

由 此 可 见 ,无论 从 哪 一 个 策略 组 合 开 始 , 最 后 都 会 移动 到 (坦白 ,坦白 ) ,这 就 是 办 徒 困 
境 的 均衡 。 

再 将 箭头 法 应 用 于 我 们 用 画 线 法 讨论 过 的 抽象 博弈 ,步骤 略 ,结果 如 图 2-20 所 示 。 

可 见 , 不 论 从 哪个 策略 组 合 人 手 ,最 终 都 会 跟随 箭头 移动 到 (下 , 右 ) ,说 明 这 个 策略 组 
合 是 该 博弈 的 均衡 。 同 时 ,没有 箭头 指出 也 反映 了 均衡 的 “稳定 性 ”。 

综合 比较 上 述 4 种 方法 ,可 以 发 现 以 下 几 点 。 

(1) 上 策 均 衡 法 : 理想 的 选择 法 , 共 赢 就 是 最 好 。 
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0, 4 4， » 
上 | + 作 要 
参与 者 ! 中 4,0 0.4 33 


图 2-20 箭头 法 整合 


(2) 严格 下 策反 复 消去 法 : 基于 推理 的 排除 法 一 一 博弈 双方 互相 揣摩 ,排除 对 手 不 
会 选择 的 策略 。 

(3) 画 线 法 : 紧 扣 分 析 的 重点 一 一 “得 益 ”; 通过 “ 面 线 ”, 寻 找 均衡 。 

(4) 箭头 法 : 逐步 寻找 博弈 何 时 能 达到 稳定 ,模拟 动态 演化 过 程 。 


2.1.3 应 用 举例 


1. 狂 鹿 博弈 
一 个 和 尚 挑 水 吃 ,两 个 和 尚 抬 水 吃 , 三 个 和 尚 没 水 吃 。 
一 一 富 言 故事 

卢梭 在 《4 论 人 类 不 平等 的 起 源 和 基础 ) 中 提 到 了 这 样 一 个 例子 : 

一 群 猎人 发 现 了 一 头 询 。 他 们 明白 ,要 想 抓 住 它 , 每 个 人 都 得 尽 全 力 。 然 而 当 其 中 茶 
个 猎人 看 见 一 只 野 免 从 面前 跑 过 的 时 候 , 他 会 之 不 犹 洛 地 选择 去 追 它 一 一 猎人 一 旦 得 到 
猎物 ,就 不 会 太 关 心 他 的 同伴 是 否 能 抓 到 他 们 的 目标 。 

为 了 方便 分 析 ,假设 参 与 猎 鹿 博弈 的 只 有 两 个 人 ,他 们 “同时 ?决定 猎 鹿 还 是 猎 免 ,对 
于 每 个 猎人 而 言 , 半 头 鹿 比 一 只 兔子 要 好 , 鹿 相 当 于 10 顿 饭 的 食物 ,兔子 只 相当 于 4 顿 。 

这 样 会 带 来 3 种 可 能 的 结果 。 

(1) 两 个 人 都 选择 猫 鹿 ,他 们 将 共同 获得 一 涉 鹿 , 二 人 平分 ,两 人 的 得 益 均 为 
10/2=5。 

(2) 两 个 人 都 猫 免 , 则 每 人 都 可 以 得 到 一 只 兔子 ,得 益 均 为 4。 

(3) 一 人 猫 鹿 而 另 一 人 跑 去 猎 兔 ,那么 猫 鹿 的 打 不 着 , 猫 兔 的 得 到 人 兔 ,得 益 分 别 为 0 
和 4。 

由 此 可 以 得 到 如 图 2-21 所 示 的 得 益 和 矩阵。 


猎人 2 
猎 鹿 猫 免 
猫 放 | 
猎人 1 
猫 免 4，0 4，4 


图 2-21 猫 鹿 博弈 得 益 矩 阵 
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不 妨 尝试 用 上 一 节 介 绍 的 4 种 方法 来 进行 研究 。 

1) 上 策 均 衡 法 

“ 某 一 个 参与 者 的 某 种 策略 给 他 带 来 的 得 益 高 于 其 他 策略 ?的 策略 叫 * 上 策 ”, 观 
察 后 发 现 , 并 不 存在 这 样 的 策略 。 

2) 严格 下 策反 复 消去 法 

对 参与 者 来 说 ,无 论 对 手 的 策略 如 何 , 都 至 少 有 一 个 策略 比 这 个 策略 好 ,此 时 我 们 说 ， 
这 个 策略 是 “严格 下 策 ”。 观 察 发 现 , 这 个 例子 中 ,双方 均 没有 严格 下 策 。 

3) 画 线 法 

按照 方法 ,我 们 一 步 一 步 对 比 博弈 的 得 益 。 

第 一 步 , 先 选取 一 个 参与 者 (这 里 以 猎人 1 为 例 ) ,比较 在 给 定 对 方 的 某 一 策略 时 ,此 
参与 者 采取 所 有 可 能 策略 的 对 应 收益 。 当 对 方 选择 “ 猫 鹿 ”时 ,自己 选择 “ 猫 鹿 ”的 收益 为 
5, 选 择 “ 猫 免 ” 的 收益 为 4。 显 然 5 之 4, 所 以 在 5 的 下 方面 一 条 线 。 当 对 方 选择 “ 猫 免 " 策 
略 时 ,自己 选择 * 猎 鹿 ?” 的 收益 为 0, 选择 * 猎 免 ”的 收益 为 4。 因 为 4 二 0, 所 以 在 4 的 下 方 
画 一 条 线 。 结 果 如 图 2-22 所 示 。 


猎人 2 
猫 应 全 
独自 | 5 0.14 
猎人 1 
蕴 免 4,0 4,4 


图 2-22 猫 鹿 博弈 的 画 线 法 分 析 步 又 


第 二 步 , 再 来 看 另 一 人 (这 里 为 猎人 2)。 当 对 方 选择 “ 猎 鹿 ”时 ,自己 选择 “ 猫 鹿 ”的 收 
益 为 5, 选 择 “ 猎 兔 " 的 收益 为 4。 因 为 5 二 4, 在 5 的 下 方面 一 条 线 。 当 对 方 选择 “ 猫 免 " 策 
略 时 ,自己 选择 “ 猫 鹿 ”的 收益 为 0, 选择 “ 猎 兔 "的 收益 为 4。 由 于 4 二 0, 在 4 的 下 方面 一 

综 上 ,可 以 得 到 ( 猫 鹿 , 猫 鹿 ) 和 ( 猎 兔 猫 兔 ) 都 是 该 博弈 的 均衡 。 结 果 如 图 2-23 
所 示 。 


图 2-23 狂 鹿 博弈 的 画 线 法 分 析 结果 


4) 箭头 法 

猎 鹿 博弈 得 益 矩 阵 的 箭头 法 分 析 结 果 如 图 2-24 所 示 。 

分 析 步 又 此 处 不 再 详 述 ,结果 表明 : 箭头 汇 向 两 处 ,说 明 有 两 个 均衡 ( 猎 鹿 , 猎 鹿 ) 和 
( 猎 免 , 猎 兔 )。 
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猎人 2 
猎 庆 猫 旬 
猫 鹿 0.4 
猎人 1 
猎 旬 4.0 dy 


图 2-24 狂 鹿 博弈 得 益 和 矩阵 的 箭头 法 分 析 结 果 


这 个 博弈 的 结果 很 有 趣 : 明明 存在 对 两 人 都 更 有 利 的 均衡 ( 猫 鹿 , 猫 鹿 ), 但 两 人 却 可 
能 共同 偏向 于 另 一 个 “较为 一 般 的 ”均衡 ( 猎 免 , 猫 兔 )。 对 其 更 深入 的 讨论 将 留 到 第 2. 4. 2 
节 , 届 时 我 们 将 讨论 策略 的 “风险 性 ”。 若 在 此 基础 上 继续 研究 猫 鹿 问题 ,将 会 接触 到 合作 
中 最 关键 的 部 分 。 我 们 将 在 第 7 章 “ 演 化 博弈 "和 第 8 章 “ 竞 争 与 合作 ”中 做 更 进一步 的 
分 析 。 


分 思考 与 练习 


狭窄 的 小 路 上 人 馆 面 来 了 一 个 骑 车 的 人 ,双方 经 常 得 左右 摇摆 几 个 回合 才能 勉强 通过 。 
遇 到 这 样 的 场景 时 ,你 该 怎么 办 ? 思考 一 下 ,和 你 所 处 的 环境 相关 吗 ? 


2. 智 猪 博弈 

假设 猪 圈 中 有 大 猪 ` 小 猪 各 一 头 。 猪 圈 的 一 边 有 猪 食 槽 , 另 一 边 是 一 个 利用 杠杆 原理 
控制 猪 食 供给 的 踏板 。 踩 一 下 踏板 就 会 有 猪 食 进 槽 ,假定 每 次 的 流出 量 为 10 份 ( 重 复 踩 
踏板 并 没有 额外 的 食物 流出 )。 但 是 踏板 不 是 随便 踩 的 。 由 于 猪 圈 两 端 间隔 很 远 ,对 每 头 
猪 而 言 ,踩踏 板 一 去 一 回 要 付出 的 劳动 相当 于 2 份 的 猪 食 。 此 外 , 当 一 头 猪 跑 去 踩 时 , 另 
一 头 猪 会 先 在 食 槽 旁边 等 待 ,也 就 是 说 ,踩踏 板 的 猪 跑 回来 ;不仅 消 耗 体力 ,而 且 能 吃 到 的 
食物 也 会 变 少 。 

先 总 结 一 下 可 能 出 现 的 情况 。 

(1) 假如 大 猪 去 踩踏 板 , 小 猪 等 待 , 则 大 猪 能 吃 到 6 份 猪 食 , 小 猪 吃 到 4 份 ( 在 被 大 猪 
赶 走 前 已 经 吃 到 了 一 些 ) 。 此 时 它们 的 得 益 分 别 为 : 大 猪 6 一 2 一 4 ,小 猪 4。 

(2) 假如 小 猪 去 踩踏 板 , 大 猪 等 待 ,大 猪 能 吃 到 9 份 猪 食 ,小 猪 只 能 吃 到 1 份 (说 不 定 
还 是 大 猪 嘴 里 漏 下 的 )。 此 时 它们 的 得 益 分 别 为 : 大 猪 9, 小 猪 1 一 2 一 一 1。 

(3) 假如 两 头 猪 同 时 去 踩 ( 虽 然 不 太 现实 ,但 也 要 加 以 考虑 ) ,大 猪 能 吃 到 7 份 猪 食 ， 
小 猪 吃 到 3 份 。 此 时 它们 的 得 益 分 别 为 : 大 猪 7 一 2 一 5, 小 猪 3 一 2 一 1。 

(4) 假如 两 头 猪 都 不 踩 ,它们 当然 会 一 起 饿 肚子 ,得 益 均 为 0。 

该 博弈 的 参与 者 是 大 猪 和 小 猪 , 每 头 猪 的 策略 集 包括 “踩踏 板 " 和 “在 食 柳 边 等 待 ”两 
种 策略 。 猪 的 得 益 是 得 到 的 食物 量 减 去 踩踏 板 消耗 的 食物 量 。 因 此 ,可 以 得 到 图 2-25 所 
示 得 益 和 矩阵 。 

问题 是 : 在 这 种 情况 下 ,大 猪 有 可 能 不 踩踏 板 坐 享 其 成 吗 ? 

首先 要 注意 到 ,小 猪 是 有 占 优 策略 的 。 意 即 ,不 论 大 猪 选择 何 种 策略 ,小 猪 "在 食 槽 边 
等 待 ” 的 得 益 永 远 比 * 踩 踏板 ?要 高 。 如 果 小 猪 是 理性 的 (姑且 假设 它 为 理性 ) , 它 一 定 会 选 
择 “ 在 食 槽 边 等 待 ”。 假 如 大 猪 相 信 小 猪 是 理性 的 (姑且 假设 它 相 信 ) , 它 就 会 明白 小 猪 去 
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大 猪 
踩 路 板 在 食 楼 边 等 竺 
中 路 板 。 | 人 | 
小 猪 
在 食 醒 边 等 待 4 ,4 0.0 


图 2-25 智 猪 博弈 得 益 矩 阵 
踩踏 板 是 不 划算 的 ,所 以 小 猪 一 定 不 会 去 踩 。 假 如 小 猪 不 踩 ,自己 也 不 踩 ,那么 它们 都 要 
俄 肚子 。 所 以 ,如 果 大 猪 理 性 ,就 应 该 去 踩踏 板 。 
必 概念 解读 ， 占 优 策略 


占 优 策略 的 简单 定义 是 : 对 于 某 一 参与 者 的 两 个 策略 S1 和 Sz , 若 Si 给 他 带 来 的 得 
益 始 终 高 于 另 一 策略 S2 的 得 益 一 一 无 论 其 他 参与 者 如 何 行动 都 是 如 此 , 则 称 策略 S1 占 
优 于 Sz; 如 果 策 略 S1 占 优 于 该 参与 者 的 所 有 其 他 可 能 策略 , 则 称 S1 是 一 个 占 优 策略 。 


因此 利用 严格 下 策反 复 消去 法 .将 得 到 图 2-26 和 图 2-27 所 示 结 果 。 


大 猪 
蹊 踏板 在 食 槽 边 等 竺 
踩踏 板 Ves -li ,9 
在 食 档 边 等 竺 4 , 罩 0, 0 


图 2-26 智 猪 博弈 严格 下 策反 复 消去 法 步骤 


大 猪 
踩踏 板 在 食 槽 边 等 待 
本 路 Ee i 
小 将 采 踏 板 
在 食 档 边 等 竺 4 oo 


图 2-27 智 猪 博弈 严格 下 策反 复 消去 法 结果 


小 猪 和 大 猪 的 博弈 会 在 (在 食 槽 边 等 待 ,踩踏 板 ) 这 一 策略 组 合 处 达到 均衡 。 

大 家 可 能 会 想 ,这 样 不 合 常理 的 假设 ( 猪 理性 且 互 知 彼此 理性 ) 符 合 实际 吗 ? 这 样 的 
理论 有 应 用 价值 吗 ? 让 我 们 来 看 一 个 真实 的 验证 实验 。 

实验 笼子 的 尺寸 是 2.8 米 和 1.8 米 。 为 了 确保 两 头 猪 有 很 强 的 食欲 ,连续 24 小 时 不 
让 其 进食 。 起 初 ,每 头 猪 都 被 单独 关 在 笼子 里 ,加 以 训练 使 其 意识 到 踩踏 板 将 会 得 到 食 
物 。 人 研究 人 员 不 是 通过 体型 来 判定 哪 头 是 “大 猪 ”、 哪 头 是 “小 猪 ”, 而 是 通过 进食 量 一 一 先 
将 猪 单独 关 在 有 充足 食物 的 猪 圈 里 ,一直 在 进食 的 那 一 头 就 是 “大 猪 ”。 

实验 结果 如 图 2-28 所 示 。 图 中 的 纵 坐 标 表示 每 15 分 钟 踏板 被 踩 动 的 次 数 , 横 坐标 
表示 的 是 尝试 的 次 数 。 尝 试 踩踏 板 的 次 数 达 到 10 次 之 前 ,这 两 头 猪 都 被 单独 关 在 笼子 
里 ,“ 大 猪 ” 踩 踏板 的 次 数 略 多 一 些 。10 次 尝试 之 后 ,它们 被 关 在 同一 个 笼子 里 ,结果 是 : 
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“大 猪 ”踩踏 板 的 次 数 越 来 越 多 。 


15 分 钟 内 踏板 踩 动 次 数 
8 


40 
20 
0 
1 
实验 次 数 
-=---4 | 猪 一 一 大 猪 


图 2-28 智 猪 博弈 每 15 分 钟 的 观察 


两 头 猪 最 终 达 到 均衡 并 不 是 因为 一 头 猪 能 够 猜测 另 一 头 猪 的 想法 ,并 做 出 合乎 博弈 
论 的 推理 。 更 大 的 可 能 是 ,它们 通过 不 断 的 尝试 变 得 聪明? 起来。 也许 小 猪 ? 在 几 次 踩 
踏板 却 只 得 到 很 少食 物 后 ,不 愿 再 踩踏 板 。 这 时 ,“ 大 猪 " 会 发 现 它 能 吃 到 食物 的 唯一 办 
法 就 是 踩踏 板 。 

总 之 ,在 不 断 的 重复 博 穿 过 程 中 ,它们 的 行为 也 确实 越 来 越 接近 预测 的 结果 。 这 有 力 
地 说 明 , 经 验 的 积累 可 以 帮助 人 们 达到 均衡 ,积累 经 验 是 在 博弈 中 获得 优势 的 好 办 法 
之 一 。 

但 是 ,重复 博弈 不 仅 能 够 训练 参与 者 的 理性 ,还 有 可 能 改变 博弈 的 均衡 结果 ,促使 参 
与 者 由 竞争 转 而 合作 。 在 第 6 章 中 ,我 们 将 进一步 就 "重复 博弈 ”展开 更 深入 的 分 析 。 


分 思考 与 练习 


1. 有 人 说 智 猪 博弈 的 结果 体现 了 “能 者 多 劳 ", 你 赞成 这 种 看 法 吗 ? 

2. 你 认为 实际 生活 中 “能 者 多 劳 ” 是 一 种 合理 的 要 求 吗 ? 

3. 假如 你 是 饲养 者 ,你 当然 希望 饲料 能 够 被 合理 分 配 , 你 会 如 何 改 变现 状 (设计 规 
则 ) ,激励 大 猪 和 小 猪 都 去 踩踏 板 呢 ? 
a 二》 游戏 与 实验 

假如 你 正在 参加 博弈 论 课程 的 结 课 考 试 ,考场 中 一 共有 50 名 考生 ,你 已 顺利 答 完 前 
面 累计 分 值 为 100 分 的 题目 ,你 现在 读 到 的 是 附加 题 : 给 你 一 个 机 会 ,你 可 以 选择 从 你 的 
卷 面 成 绩 中 ,贡献 出 至 多 5 分 。 你 贡献 的 分 数 在 翻 两 倍 之 后 ,会 被 平分 给 考场 中 参加 考试 
的 所 有 考生 。( 举 个 例子 ,假如 批改 试卷 后 得 知 你 的 卷 面 成 绩 为 90 分 ,所 有 人 都 选择 贡献 
5 分 ,每 个 5 分 翻 倍 变 成 10 分 ,总 计 500 分 ,平分 给 50 个 人 ,每 人 10 分 。 那 么 现在 你 的 卷 
面 成 绩 将 是 90 一 5 十 10 二 95 分 。) 请 写 出 你 愿意 贡献 出 的 分 数 。 
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如 果 你 是 勤奋 的 自学 读者 ,也 可 以 找 4 个 小 伙伴 一 起 来 进行 这 个 实验 ,规则 不 妨 改 
成 : 每 个 人 最 初 拥有 10 个 棋子 (或 其 他 指示 物 ), 可 以 选择 贡献 出 一 些 棋子 ,5 个 人 贡献 的 
棋子 总 和 的 两 们 将 均 分 给 大 家 (如 果 不 能 均 分 则 舍弃 多 余 的 棋子 ) ,一 轮 游戏 后 棋子 最 多 
的 人 获胜 。 


2.1.4 基础 知识 


相信 大 家 此 时 已 经 对 博弈 分 析 的 方法 有 些 感觉 了 ,那么 是 时 候 向 下 一 个 山头 攀登 了 。 

从 第 1 章 的 导论 到 现在 ,虽然 已 经 介绍 并 使 用 了 大 量 的 概念 ,但 是 这 些 概念 背后 的 明 
确 含义 还 未 介绍 。 仅 了 解 一 些 简 单 的 外 部 特征 是 不 够 的 ,我 们 还 要 深入 细节 ,体会 博弈 语 
言 的 内 涵 。 换 言 之 ,在 对 参与 者 行为 进行 严密 的 分 析 之 前 ,必须 对 可 能 涉及 的 名 词 进行 严 
格 定义 ,对 特定 的 情景 进行 适当 的 假设 。 

从 现在 起 ,我 们 将 引入 一 些 数学 符号 ,重新 严格 地 定义 一 些 大 家 已 经 熟悉 的 概念 ,并 
补充 更 多 的 新 术语 。 用 语言 学 的 观点 来 说 ,词汇 量 的 增加 可 以 加 深入 们 思考 的 深度 。 当 
然 , 在 表达 需要 的 前 提 下 ,本 书 力求 将 数学 难度 降 到 最 低 , 以 方便 读者 理解 。 非 课堂 讲授 
的 读者 可 越过 本 节 。 

1. 策略 与 策略 组 合 

我 们 最 先 接触 到 的 概念 是 “博弈 ”。 

在 一 个 n 人 博弈 的 标准 型 表述 中 ,参与 者 的 策略 集 为 Si,Sz,…',S, ,得 益 函 数 为 1， 
wz， sun， 在 此 用 G 二 {S91,Sz ，,… ,Sn; ul,uz，… ,un} 表 示 此 博弈 。 

每 一 个 参与 者 的 行动 都 值得 我 们 单独 研究 .我 们 常用 i 来 称呼 某 个 参与 者 ,用 小 写 的 
si 表示 参与 者 可 选择 的 策略 ,用 大 写 的 Si 表示 参与 者 i 的 策略 集 ,那么 s;€ S;。 用 大 写 的 
S 来 表示 策略 组 合 : 

S= (s,s2.°" ,5n) 

策略 组 合 表示 的 是 博弈 的 所 有 参与 者 的 策略 的 集合 , 即 第 1 个 人 选择 策略 51 ,第 二 个 
人 选择 策略 sz ,第 i 人 选择 策略 s;…… 以 此 类 推 至 参与 者 n。 

为 了 简化 书写 ,用 s-; 表 示 除 参与 者 i 之 外 其 他 所 有 参与 者 的 策略 构成 的 组 合 , 即 

si= (8 383 1 gt ya)s Viss-i€ES-0 

这 样 我 们 可 以 将 策略 组 合 写成 S 二 (5i,s-i) ,非常 简洁 方便 。 

2. 理性 和 信念 

上 面 的 几 个 概念 是 用 来 描述 博弈 自身 性 质 的 。 博 弈 的 历程 和 结果 离 不 开 人 的 判断 与 
选择 ,因此 要 想 分 析 一 个 给 定 的 博弈 ,还 需 一 套用 来 刻画 参与 者 动机 和 行为 的 工具 。 

“理性 ”是 其 中 极为 重要 的 概念 。 在 本 书 绝 大 多 数 案例 中 ,参与 者 都 是 理性 的 。 事 实 
上 ,经 典 博弈 论 体 系 几乎 所 有 的 理论 都 是 建立 在 “理性 ”基础 之 上 的 。 因 此 ,准确 把 握 “ 理 
性 ”这 一 概念 非常 重要 。 

此 前 我 们 对 理性 的 解释 是 : 若 一 个 参与 者 采取 策略 来 最 大 化 自己 利益 ,那么 他 就 是 


@ Y 是 个 写 的 A, 代 表 任 意 (Any); 而 了 则 是 反 写 的 EE, 表示 存在 (Exist)。 
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理性 的 。 深 入 探究 ,怎样 才 算 “采取 了 最 大 化 利益 的 策略 " 呢 ? 

参与 者 必须 先 对 各 种 策略 带 来 的 利 刺 有 所 判定 ,才能 在 其 中 进行 比较 ,挑选 出 自己 认 
为 最 有 利 的 策略 。 这 个 过 程 可 以 狭义 地 比 作 : 参与 者 在 脑海 中 (或 者 在 纸 上 ) 拟 出 了 “得 
益 和 矩阵 ”, 比 较 数 字 大 小 , 依 此 判断 哪个 策略 更 好 。 广 义 地 说 ,这 种 行为 是 : 在 博弈 的 结局 
出 现 之 前 ,考虑 各 种 可 能 出 现 的 情况 ,评价 各 种 情况 出 现 的 概率 ,以 此 为 依据 ,最 终 从 策略 
集中 选择 一 种 最 为 合适 的 策略 。 

在 博弈 论 中 ,把 对 其 他 参与 者 行动 所 进行 的 先 验 判断 ? 称 为 对 他 们 的 “信念 "。 简 单 
而 言 ,信念 就 是 对 对 手 行动 的 预测 。 

数学 上 ,参与 者 i 的 信念 是 关于 其 他 参与 者 的 策略 2 的 一 个 概率 分 布 。 我 们 用 w-; 来 
表示 , 且 有 py-i:EAS-i, 其 中 AS-; 是 指 除了 参与 者 i 之 外 其 他 所 有 参与 者 的 策略 的 概率 
分 布 集合 。 大 写 S 前 的 A 表示 这 个 集合 是 概率 分 布 的 集合 。 

据 此 ,我 们 重新 定义 理性 。 

定义 2.3 根据 各 自 对 其 他 参与 者 的 信念 ,参与 者 选择 使 自己 得 益 最 大 的 策略 , 称 为 
理性 。 

在 博弈 中 ,参与 者 不 一 定 会 选择 某 个 特定 的 策略 。 辟 如 ,对 参与 者 i 来 说 A 和 B 策 
略 都 很 好 ,这 令 i 拿 不 定 主 意 。i 或 许 会 随机 选择 其 中 一 个 ,或 许 会 按 其 偏好 进行 选择 。 
这 样 的 “策略 "显然 与 我 们 此 前 用 的 “策略 ”一 词 含 义 不 同 。 

因此 ,我 们 引入 “混合 策略 ”的 概念 。 参 与 者 的 一 个 混合 策略 是 指 他 可 采取 的 一 种 “ 根 
据 概率 分 布 对 策略 进行 选择 ”的 行动 。 比 如 参与 者 i 有 两 个 策略 A 和 了 ,他 以 1/3 的 概率 
选 A,2/3 的 概率 选 B, 这 样 将 所 有 可 能 1” 分 配给 两 个 策略 ,构成 的 就 是 一 个 “混合 策 
略 ”。 如 同 信念 一 样 ,混合 策略 也 是 用 概率 分 布 衡量 ,所 以 我 们 也 用 类 似 的 方法 表述 参与 
者 i 的 混合 策略 为 o;€ AS; , 指 除 了 参与 者 i 可 选 策 略 的 概率 分 布 集合 。 

为 了 有 所 区 别 ,我们 将 一 般 的 策略 称 为 * 纯 策略 ”。 不 过 在 2. 3 节 之 前 一 般 不 会 有 这 
样 的 误会 ,我 们 仍 用 “策略 ” 指 代 纯 策 略 。 需 要 特别 注意 的 是 , 纯 策略 是 混合 策略 的 特殊 情 
况 , 二 者 是 包含 关系 而 不 是 对 立 关系 。 

当 引入 了 信念 与 混合 策略 后 ,得 益 该 如 何 分 析 呢 ? 为 此 ,还 需 进一步 引入 期 望 的 概念 。 

当 参 与 者 i 对 其 他 参与 者 具有 信念 w-:… 并 打算 选择 策略 %; 那么 他 的 期 望 得 益 等 于 
他 采取 策略 s; 而 其 他 人 根据 py-; 采 取 行 动 时 的 “平均 "得 益 。 

用 数学 表达 式 表 示 为 


Ui(sisp-i) 一 和 pi(s-i)ui(si» si) 
si€S, 


举 个 例子 ,A 和 也 两 个 人 进行 猜 硬币 博弈 : B 抛 硬币 ,A 来 猿 。 如 果 A 猜 中 了 ,B 给 
A 一 个 硬币 , 猜 错 则 A 给 B 一 个 硬币 。A 对 B 可 能 采取 的 混合 策略 的 信念 为 概率 分 布 
(50% ,50%), 因 此 不 论 自己 猜 正 还 是 猜 反 , 获 胜 的 概率 都 为 50%。 此 时 两 人 的 策略 集 


@ 关于 先 验 和 后 验 ,读者 可 参阅 附录 的 有 关内 容 。 
@ 在 本 章 ,因为 参与 者 的 行动 只 有 一 步 . 所 以 我 们 不 加 区 分 地 使 用 “策略 "与 “行动 ”两 个 词汇 不 会 引起 误会 ; 而 
在 动态 博弈 中 策略 是 针对 多 种 可 能 情况 的 指导 原则 ,而 行动 则 只 是 某 个 阶段 参与 者 的 某 一 选择 ,请 注意 区 别 。 
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SA 一 SB 一 ( 正 , 反 )。 

令 yp( 正 ) 二 yp( 反 ) 二 50% 是 抛 硬币 的 概率 。 设 A 猜 正 的 期 望 得 益 为 wxA( 正 ,wa)。 
根据 公式 可 得 

MA( 正 ,pB) 王 HpB( 正 ) Xua( 正 ,; 正 ) 十 yB( 反 ) Xua( 正 , 反 ) 
一 50%X(+1) 十 50% XxX(—1)=0。 

上 式 中 ua( 正 , 正 ) 表 示 A 猜 正 且 B 抛 出 的 硬币 也 为 正 时 A 的 得 益 。 此 时 A 猜 中 
了 ,得 益 为 十 1。 同 理 wa( 正 , 反 ) 表 示 A 没 猜 中 的 得 益 ,为 一 1 。 

这 样 , 我 们 就 刻画 了 参与 者 如 何 判 定 各 种 策略 的 对 应 得 益 , 下 一 步 是 对 它们 进行 比 
较 。 具 体 而 言 , 如 何 衡量 混合 策略 哪 种 更 好 呢 ? 为 此 ,我 们 又 引入 一 个 新 的 评判 标准 ,来 
描述 混合 策略 间 的 优 劣 关系 。 

3. 占 优 与 最 优 反应 

在 使 用 上 策 均 衡 时 ,我们 已 感受 过 它 的 局 限 性 ,因此 我 们 需要 更 为 普遍 适用 的 工具 。 

下 面 将 介绍 博弈 理论 中 两 个 更 核心 的 概念 ,一 个 叫 作 ”* 占 优 ”, 一 个 叫 作 * 最 优 反应 ”。 
它们 是 在 冯 ， 诺 依 曙 和 摩根 斯 坦 的 《博弈 和 经 济 行为 理论 ) 以 及 卢 斯 (Robert Duncan 
Luce) 和 雷 法 (Howard Raiffa) 的 《博弈 和 决策 )》 中 引入 的 。 

这 两 个 概念 是 个 体 理性 理论 的 基础 ,值得 我 们 深入 理解 。 个 体 理 性 或 许 是 个 新 名 词 ， 
但 它 并 不 是 一 个 新 概念 。 它 是 我 们 此 前 一 直 在 用 的 理性 一 词 更 准确 的 说 法 。 事 实 上 ,我 
们 常 讨 论 的 理性 分 为 两 种 : 一 种 是 追求 个 人 利益 最 大 化 的 理性 , 称 为 个 体 理性 ; 另 一 种 
是 以 集体 利益 最 大 化 为 目标 的 , 称 为 集体 理性 。 我 们 会 在 第 8 章 中 详细 介绍 集体 理性 相 
关 的 内 容 ( 在 此 之 前 ,如 不 会 引起 误会 ,我们 仍 用 ”理性 ?一 词 表 达 个 体 理性 ,请 留意 ) 。 

1) 优 与 劣 

之 前 一 直 使 用 的 “上策 ”一 词 , 描 述 的 正 是 “ 占 优 ” 的 关系 。 简 单 来 说 ,“ 占 优 ”的 定义 
是 : 不 论 其 他 参与 者 选择 何 种 策略 , 某 一 个 参与 者 i 选择 策略 s; 给 他 带 来 的 得 益 始 终 严 
格 高 于 另 一 策略 si ,我 们 称 策略 si 占 优 于 si。 

可 见 , 占 优 的 条 件 很 容易 达成 。 然 而 上策” 的 概念 则 相当 苛刻 : 某 一 策略 占 优 于 其 
他 所 有 策略 , 才 可 称 为 “上策 ”。 显 然 , 所 有 参与 者 若 想 达成 “上 策 均 衡 ” 则 更 加 困难 。 因 
此 ,“ 上 策 ” 这 一 概念 在 描述 博弈 时 并 不 方便 ,我 们 将 把 更 多 的 注意 力 放 在 占 优 关系 上 。 

男 外 ,与 占 优 类 似 但 意思 完全 相对 的 概念 是 劣 于 ,二 者 可 以 一 起 被 定义 。 

定义 2.4 对 于 参与 者 i 的 纯 策略 , 存 在 策略 (无 论 是 纯 策 略 还 是 混合 策略 )oi€ ASi， 
如 果 对 于 其 他 参与 者 的 所 有 策略 组 合 s-iE S-i 均 能 满足 ui(gi,s-i) 之 ui(si,s-i) ,我 们 就 
称 si 劣 于 aisoi 占 优 于 si。 

对 于 任意 一 个 策略 , 若 它 占 优 于 另 一 策略 : 则 称 之 为 “ 占 优 策略 ”。 相 反 , 若 它 劣 于 另 
一 策略 , 则 称 " 严 格 劣 策略 ”。 占 优 策略 也 可 称 * 严 格 占 优 策 略 ”, 二 者 含义 完全 一 样 。 

2) 最 优 反 应 与 信念 

另 一 个 很 实用 的 概念 是 最 优 反应 或 称 最 优 回应 。 简 单 来 说 ,作为 一 个 参与 者 , 若 你 相 
信 对 方 会 采取 某 一 种 策略 ,而 你 针对 这 种 策略 做 出 了 一 种 能 最 大 化 自身 得 益 的 行动 ( 策 
略 ) ,那么 这 种 行动 (策略 ) 就 是 你 的 “最 优 反 应 ”。 混 合 策略 的 情形 稍 复杂 一 些 , 此 处 我 们 
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先 给 出 纯 策略 条 件 下 最 优 反应 的 正式 定义 。 

定义 2.5 假设 参与 者 i 对 于 其 他 参与 者 采取 的 策略 具有 信念 -i;E AS-i, 参 与 者 i 
的 策略 si 如 果 对 于 任何 si € Si 都 满足 wui(sispy-i) 宇 ui(si,py-i), 那 么 si 就 是 一 个 最 优 
反应 。 

我 们 将 在 2. 3 节 定 义 最 优 反应 概念 向 混合 策略 的 扩展 。 

不 难 证 明 ,在 一 个 有 限 博弈 中 ,每 个 信念 至 少 对 应 一 个 最 优 反 应 。 信 念 一 旦 形成 ,就 
会 有 相应 的 最 优 反应 。“ 不 管 我 们 是 否 已 经 找 出 , 它 就 在 那里 ”从 这 个 意义 上 说 ,决策 是 
否 正确 ,依赖 于 信念 是 否 正确 。 

举例 来 说 ,假如 你 (麦子) 和 丈夫 正在 商量 今年 去 谁 家 过 年 。 图 2-29 所 示 的 夫妻 之 争 
得 益 和 矩阵 描述 了 当 二 人 意见 统一 或 不 一 致 时 的 得 益 。“ 非 常 愉快 "对 应 的 得 益 设 为 3,“ 勉 
强 能 接受 "为 1,“ 闵 矛盾" 则 为 0。 

妻子 
去 丈夫 家 去 妻子 家 


去 丈夫 家 
去 妻子 家 


丈夫 


3， 
0 


图 2-29 夫妻 之 争 得 益 卸 阵 


根据 你 对 丈夫 的 了 解 , 你 知道 他 很 希望 回 自己 家 过 年 。 但 是 自己 也 想 抽 时 间 陪 陪 父 
母 , 此 时 你 该 怎么 选择 ?如何 避免 争执 ? 

争执 是 否 出 现 的 决定 性 因素 在 于 : 丈夫 的 想法 是 否 真 的 如 你 所 料 , 即 你 的 信念 的 正 
确 性 。 

假如 你 的 信念 正确 ,对 应 你 的 信念 的 最 优 反应 是 ”和 他 一 起 回 家 ”, 结 果 夫 妻 关 系 和 
睦 ,高 高 兴 兴 过 年 。 假如 你 的 信念 错误 ,你 丈夫 实际 的 想法 是 "今年 该 陪 你 回 家 过 年 了 ”， 
而 对 应 你 的 信念 (丈夫 想 回 家 过 年 ) 的 最 优 反应 仍 是 "和 他 回 家 ”。 这 时 若 仍 按 最 优 反应 去 
做 ,实际 上 不 一 定 是 最 好 的 结果 。 

可 见 最 优 反应 带 来 好 结果 的 前 提 是 : 信念 正确 。 在 博弈 中 ,人 们 往往 会 下 很 大 功夫 
力求 形成 正确 的 信念 。 博 弈 的 成 功 与 否 往往 取决 于 你 对 对 手 的 了 解 是 否 超 过 对 手 对 你 的 
了 解 。 

实际 上 , 面 对 生 活 中 出 现 的 各 种 矛盾 ,人 们 发 现 沟通 是 一 个 非常 有 效 的 手段 , 它 往往 
对 博弈 结果 有 很 强 的 影响 。 换 名 话说 ,通过 各 种 形式 的 沟通 ,可 以 协调 双方 的 偏好 ,更 新 
双方 的 信念 而 使 之 更 为 准确 。 在 后 面 的 学 习 中 还 会 涉及 “如 何 沟通 ”。 

4. 下 策 与 可 理性 化 * 

上 一 节 告 诉 我 们 什么 样 的 策略 好 ,以 及 为 什么 好 。 这 一 节 将 讨论 哪些 策略 不 好 ,以 及 
它们 为 什么 不 好 。 

回想 一 下 前 面 介绍 过 的 “严格 下 策反 复 消去 法 ”, 我 们 消去 的 正 是 “严格 下 策 ”。 
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1) 严格 下 策 

在 标准 型 博弈 中 , 令 st 和 :代表 参与 者 i 的 两 个 可 行 策略 (st 和 st 是 Si 中 的 元 素 ) 。 
如 果 对 其 他 参与 者 的 每 一 个 可 能 的 策略 组 合 ,i 选择 sf 的 收益 小 于 其 选择 sf 的 收益 , 即 

Ui(S1 9 3 Stl 950 3 Sit1 se" Sn) < Ui(sl see ssi=1 ss sit 9" Sn) 
对 其 他 参与 者 在 其 策略 集 S1,…, Si-1, Si=1,…,S。 中 每 一 组 可 能 的 战略 (51,…, si-1， 
5i+1s… ,sn) 都 成 立 , 则 称 策略 sf 相对 于 策略 sf 是 严格 下 策 , 也 称 严格 劣 策 略 。 

在 使 用 严格 下 策反 复 消去 法 时 ,你 是 否 产 生 过 这 样 的 疑问 : 凡是 严格 下 策 都 可 以 消 
去 吗 ? 事实 上 并 非 如 此 ,如 想 将 严格 下 策 消去 ,还 需要 满足 一 个 条 件 ,这 个 条 件 被 称 为 "可 
理性 化 ”。 只 有 当 一 个 博弈 “可 理性 化 ”时 ,我们 才能 使 用 严格 下 策反 复 消去 法 。 

2) 可 理性 化 

黑 衣 人 : 好 吧 , 毒 药 在 哪 ? 这 场 游 戏 才 刚刚 开始 。 你 先 挑 ,然后 我 们 同时 喝 下 ,不 管 
谁 生 、 谁 死 ,游戏 都 将 结束 。 

威 效 尼 : 这 太 简 单 了 吧 。 我 只 要 猜测 你 的 想法 就 行 。 你 喜欢 把 毒药 放 在 自己 的 杯子 
里 还 是 对 手 的 杯子 里 ? 聪明 的 人 总 是 会 把 毒药 放 在 自己 的 杯子 里 ,因为 他 知道 只 有 大 傻 
瓜 才 选择 自己 眼前 的 东西 。 我 不 是 傻瓜 ,所 以 我 不 会 选择 你 面前 的 酒 。 但 是 ,你 一 定 知道 
我 不 是 大 傻瓜 ,那么 我 当然 也 不 会 选择 放 在 自己 面前 的 酒 。 


一 节选 自 电影 (公主 新 娘 》 

若 在 博弈 中 ,理性 是 共同 知识 , 则 称 这 个 博弈 是 可 理性 化 的 。 理 性 是 共同 知识 的 意思 
是 : 每 个 参与 者 是 理性 的 ,每 个 参与 者 也 知道 别 的 参与 者 是 理性 的 ,每 个 参与 者 都 知道 别 
的 参与 者 知道 他 是 理性 的 …… 以 此 类 推 。 

共同 知识 这 个 概念 最 初 是 由 美国 逻辑 学 家 刘易斯 (C. I. Lewis) 于 1969 年 在 讨论 “ 协 
约 " 时 提出 的 。 他 认为 , 某 种 东西 要 成 为 多 方 的 “协约 ”, 必 须 成 为 缔约 各 方 的 共同 知识 。 
也 就 是 说 ,缔约 各 方 不 但 都 要 知道 协约 的 内 容 , 而 且 还 要 知道 各 方 都 知道 协约 的 内 容 ,等 
等 。 后 来 "共同 知识 ”又 被 诸多 学 者 研究 ,现在 已 经 成 为 逻辑 学 、 博 弈 论 、 人 工 智 能 等 学 科 
中 频繁 使 用 的 一 个 概念 。 

反复 剔除 严格 下 策 的 过 程 可 以 将 策略 理性 化 。 经 严格 下 策反 复 消 去 后 , 剩 下 的 策略 
叫 作 ” 理 性 化 的 策略 ”。 人 们 可 以 在 剩 下 的 策略 中 继续 施行 严格 下 策 消去 法 ,直至 找到 

让 我 们 来 看 图 2-30 所 示 的 一 个 抽象 的 博弈 。 


左 中 右 
必 | 1.0 | 1 | Dal 
参与 者 ! 
下 多 四 
图 2-30 抽象 博弈 得 益 和 矩阵 


参与 者 1 有 两 个 可 能 策略 :“ 上 ”和 “下 ”; 参与 者 2 有 三 个 可 能 策略 “ 左 “ 中 ”和 *“ 右 ”。 
分 析 如 下 。 
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如 图 2-30 所 示 ,对 于 参与 者 1,“ 上 ”和 “下 ”都 不 是 上策”, 即 这 两 种 策略 都 不 是 “严格 
占 优 的 ”: 如 果 参 与 者 2 选择" 左 ?，“ 上 ?” 优 于 “下 ”(1 之 0) ,但 如 果 参 与 者 2 选择 “ 右 ”,“ 下 ” 
优 于 “上 ”(2 二 0) ,结果 如 图 2-31 所 示 。 


参与 者 2 
点 中 右 
上 0,o a 日 ， 
让 0.3 0.1 日 ,% 
图 2-31 抽象 博弈 得 益 和 矩阵 分 析 步 骤 一 
但 对 于 参与 者 2,“ 右 "策略 严格 劣 于 “中 "策略 (2 二 1 且 1 二 0) ,如 图 2-32 所 示 。 


参与 者 2 
左 中 右 


| 1,0 1, 日 0 ,由 
下 0,3 "省 2, 回 
图 2-32 ”抽象 博弈 得 益 和 矩阵 分 析 步 骤 二 
因此 理性 的 参与 者 2 不 会 选择 " 右 " 策 略 。 如 果 参 与 者 1 知道 参与 者 2 是 理性 的 ,他 
就 可 以 将 “ 右 " 策 略 从 参与 者 2 的 策略 集中 剔除 。 即 该 博弈 等 同 于 图 2-33 所 示 的 博弈 。 
参与 者 2 


参与 者 1 


参与 者 1 


图 2-33 一 步 简 化 后 的 抽象 博弈 得 益 矩 阵 


在 图 2-33 中 ,对 于 参与 者 1,“ 下 "策略 成 了 相对 于 “上 "策略 的 “严格 下 策 ”。 
因此 ,如 果 在 前 面 所 述 “ 参 与 者 1 知道 参与 者 2 理性 ”的 前 提 下 ,附加 上 “参与 者 2 知 
道 参与 者 1 是 理性 的 ”以 及 “参与 者 2 清楚 “参与 者 1 知道 自己 是 理性 的 '”, 那 么 参与 者 2 
就 可 以 将 "下 ”从 参与 者 1 的 策略 集中 剔除 ,得 到 图 2-34 所 示 的 博弈 。 
参与 者 2 
左 中 
参与 者 1 上 ba0 1 这 


图 2-34 两 步 简化 后 的 抽象 博弈 得 益 矩 阵 


此 时 对 于 参与 者 2 来 说 ,“ 左 ”又 成 了 严格 下 策 。 因 此 最 后 仅 剩 的 策略 组 合 ( 上 ,中 ) 就 
是 该 博弈 的 结果 。 
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可 以 认为 ,可 理性 化 是 完全 版 的 严格 下 策反 复 消 去 法 。 这 种 方法 为 我 们 提供 了 一 种 
很 好 的 ”排除 ?思路 ,启发 我 们 在 不 能 直观 地 找到 问题 答案 时 ,不 断 地 尝试 排除 ,一 步 步 
推理 。 

使 用 严格 下 策反 复 消 去 法 时 要 注意 以 下 两 点 。 

(1) 每 一 次 消去 下 策 时 都 要 求 所 有 参与 者 清楚 。 如 果 想 将 过 程 推进 到 任意 多 步 , 就 
需要 我 们 假设 “参与 者 是 理性 的 "是 共同 知识 。 这 是 博弈 论 中 一 个 非常 强 的 假定 ,只 在 完 
全 信息 的 条 件 下 较为 常用 。 


(2) 该 方法 有 时 不 能 预测 博弈 的 结果 。 例 如 ,图 2-35 所 示 的 博弈 ,就 没有 可 以 剔除 
的 严格 下 策 。 


参与 者 2 
左 中 者 
参与 者 1 
图 2-35 无 严格 下 策 的 博弈 
2.2 纳什 均衡 
2.2.1 纯 策略 纳什 均衡 


此 前 我 们 也 提 过 “ 纯 策 略 实际 上 是 混合 策略 的 一 种 特殊 情况 ”, 我 们 不 妨 先 看 看 “ 纯 策 
略 ” 的 特殊 情况 ,再 将 其 推广 到 一 般 。 


事实 上 ,在 前 一 节 中 我 们 已 经 多 次 遇 到 纯 策略 纳什 均衡 ,如 图 2-36 一 图 2-38 所 示 博 
弈 中 的 均衡 。 


囚徒 乙 
沉默 坦白 
沉默 -2 ,-2 -9 ,0 
囚徒 甲 
坦白 9,3 


猎人 2 
猫 认 猎狗 
网 村 0 
Ei 
猎狗 4.0 


图 2-37 猫 鹿 博弈 得 益 矩 阵 


踩踏 板 本 -1，2 
在 食 模 边 等 待 0.0 
图 2-38 智 猪 博弈 得 益 短 阵 


被 圈 出 的 策略 组 合 正 是 各 个 博弈 的 纯 策 略 纳什 均衡 。 对 于 纯 策 略 纳什 均衡 ,可 以 从 
“最 优 反应 ”的 角度 来 理解 : 假如 参与 者 达成 了 纳什 均衡 ,他 们 各 自 的 选择 都 会 是 针对 其 
他 人 策略 的 “最 优 反 应 ”; 亦 即 , 如 果 每 个 参与 者 都 主动 采取 应 对 其 他 所 有 人 策略 的 “最 优 
反应 ”, 那 么 他 们 将 会 达成 纳什 均衡 。 

因此 ,可 以 这 样 定义 一 个 纯 策略 纳什 均衡 : 给 定 其 他 人 的 策略 ,如 果 每 个 参与 者 所 采 
取 的 策略 都 是 自己 的 最 优 反 应 ,那么 此 时 达成 的 策略 组 合 构成 一 个 纯 策略 纳什 均衡 。 在 
纳什 均衡 处 ,所 有 参与 者 都 是 “你 愿意 ,而且 我 愿意 ”的 状态 。 若 其 他 人 的 策略 不 变 , 任 何 
参与 者 都 没有 动机 单方 面 偏离 均衡 , 转 而 采取 其 他 策略 。 纳 什 均衡 的 数学 语言 描述 为 

定义 2.6 对 于 一 个 策略 组 合 sSES, 当 且 仅 当 si€ BRi(s-i) 对 于 每 个 参与 者 i 都 成 
立时 ,我 们 称 s 为 一 个 纯 策略 纳 什 均衡 , 式 中 BRi(s-i) 表 示 参 与 者 i 为 了 应 对 其 他 参与 者 
的 策略 组 合 s-; 的 最 优 反应 集合 。 

由 最 优 反应 的 概念 可 以 看 出 ,对 于 任意 参与 者 i 的 任何 其 他 策略 si€ Si 来 说 ,都 有 ui 
(sio5 一 门生 ui(sf,s-i)。 而 这 正 与 画 线 法 的 思想 相 吻 合 。 因 而 画 线 法 是 寻找 纯 策略 纳什 
均衡 的 一 个 常用 且 方 便 的 方法 。 

在 办 徒 困 境 中 ,内 徒 甲 和 办 徒 乙 应 对 对 方 策 略 的 最 优 反 应 均 为 “坦白 ”, 因 此 策略 组 合 
(坦白 ,坦白 ) 成 为 纳什 均衡 。 猎 鹿 博 弈 中 ,每 个 猎人 应 对 其 他 猎人 的 ” 狂 鹿 ?的 最 优 反 应 为 
“ 猫 鹿 ”, 应 对 其 他 猎人 * 猫 兔 ”策略 的 最 优 反应 为 * 猫 兔 ”, 因 此 ( 猎 鹿 , 猫 鹿 ) 和 ( 猎 兔 , 猫 兔 ) 
都 是 纳什 均衡 。 

纳什 均衡 是 普遍 存在 的 ?, 因 而 具有 很 强 的 普遍 适用 性 ; 同时 ,纳什 均衡 也 同上 策 均 
衔 一 样 具 有 很 强 的 预测 一 致 性 。 一 般 而 言 , 具 有 有 限 策略 的 有 限 个 参与 者 所 构成 的 博弈 
一 定 存在 纳什 均衡 。 这 种 纳什 均衡 既 可 以 是 纯 策 略 的 ,也 可 以 是 混合 策略 的 。 上 文 涉及 
的 纯 策略 纳什 均衡 仅 是 极为 常见 的 一 类 情况 ,下 一 小 节 仍 将 讨论 纯 策 略 纳什 均衡 ,不 过 策 
略 集 将 从 有 限 个 策略 推广 到 无 限 个 策略 。 


总 概念 解读 


1. 对 每 个 参与 者 来 说 , 纯 策 略 纳什 均衡 一 定 是 占 优 策略 吗 ? 
答 : 不 一 定 。 占 优 策略 均衡 (上 策 均衡 ) 一 定 是 纳什 均衡 ,而 纳什 均衡 不 一 定 是 占 优 
策略 均衡 。 举 个 例子 , 猎 鹿 博弈 中 的 纳什 均衡 ( 猎 免 , 猎 免 ) 就 不 满足 这 个 说 法 。 


小 猪 


@ 纳什 均衡 的 普遍 存在 性 证 明 需 要 用 到 不 动 点 理论 和 相关 的 数学 知识 ,读者 可 参阅 (博弈 论 )( 朱 。 费 登 博 格 和 
让 “ 梯 若 尔 著 ) 。 
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2. 对 每 个 参与 者 来 说 , 纯 策 略 纳什 均衡 一 定 是 最 优 反 应 吗 ? 

答 : 是 的 ,不 仅 纯 策 略 纳什 均衡 是 ,混合 策略 纳什 均衡 也 是 。 

3. 纯 策 略 纳什 均衡 是 否 会 被 严格 下 策反 复 消 去 法 消去 ? 

答 : 不 会 ,严格 下 策反 复 消 去 法 作用 后 剩 下 的 都 是 “理性 化 的 策略 ” ,严格 下 策反 复 消 
去 法 是 重复 别 除非 最 优 反应 的 过 程 。 


2 扩展 阅读 : 纳什 均衡 的 诞生 


在 博弈 论 诞生 初期 ,并 不 存在 一 种 分 析 方 法 能 够 “洞察 本 质 ”, 适 用 于 各 种 各 样 的 
博弈 。 

博弈 论 的 创始 人 之 一 冯 。 诺 依 曼 进行 了 长 期 的 尝试 ,提出 了 “最 大 最 小 定理 ”。 这 个 
定理 描述 了 在 任何 时 候 , 两 人 参与 的 零 和 博弈 总 存在 一 个 “能 使 参与 者 可 能 的 最 小 收入 最 
大 化 ”的 最 大 最 小 均衡 。 这 个 定理 确实 具有 一 定 的 普 适 性 ,但 仍然 十 分 有 限 。 

第 一 ,最 大 最 小 均衡 只 能 解释 二 人 参与 的 博弈 。 现 实 中 的 博弈 参与 者 常常 超过 两 个 。 
为 了 弥补 这 一 缺陷 , 冯 。 诺 依 曼 与 摩根 斯 坦 在 (博弈 论 与 经 济 行为 ) 一 书 中 重点 讨论 过 多 
人 参与 的 博弈 ,但 他 们 自己 也 未 能 证 明 对 于 所 有 这 样 的 博弈 均衡 解 总 是 存在 的 。 

第 二 ,现实 中 大 多 数 情况 下 ,参与 者 两 方 的 得 益 并 不 是 “ 零 和 ”的 。 比 如 在 当时 最 受 经 
济 学 家 关注 的 军事 领域 中 ,博弈 几乎 都 是 非 零 和 的 : 一 场 战 争 很 可 能 带 来 两 败 俱 伤 的 后 
果 , 胜 者 所 胜 不 能 与 败 方 所 败 画 等 号 。 为 了 扩展 理论 来 描述 非 零 和 博弈 的 情况 , 冯 。，。 诺 依 
曼 通 过 引入 一 个 虚构 的 局 中 人 ,用 于 消费 过 剩 资源 或 弥补 赤字 ,从 形式 上 将 这 样 的 博弈 转 
化 为 零 和 博弈 。 这 的 确 是 一 种 解决 问题 的 思路 ,但 是 并 不 能 被 人 们 广泛 接受 一 一 这 个 过 
程 操作 复杂 ,虚构 的 局 中 人 的 现实 意义 也 不 明确 。 尽 管 冯 。 诺 依 曼 的 最 大 最 小 理论 离 “ 普 
世 的 方法 ” 仍 有 距离 ,但 在 此 后 很 长 一 段 时 间 内 他 们 所 关注 的 零 和 博弈 依然 占据 着 博弈 论 
研究 的 核心 地 位 。 

20 世纪 40 年 代 后 期 ,在 博弈 论 的 发 源 地 普林斯顿 大 学 ,聚集 了 一 大 批 研究 博弈 论 的 
数学 家 和 经 济 学 家 。 他 们 当时 研究 的 主要 目的 正 是 将 严格 的 数学 理论 引入 美 苏 军事 冲突 
以 及 经 济 分 析 中 。“ 零 和 博弈 让 所 有 人 都 觉得 很 烦躁 ,” 经 济 学 家 肯 尼 思 。 阿 罗 (Kenneth 
Arrow) 回 忆 道 , "你 得 决定 要 不 要 开战 ,而 你 又 不 能 说 失败 者 失去 多 少 胜利 者 就 得 多 少 ， 
这 确实 太 烦 人 了 。” 

在 那 时 ,年 轻 的 纳什 正在 普林斯顿 大 学 数学 系 攻读 博士 学 位 。 冯 。 诺 依 曼 理论 中 的 
缺陷 ,就 像 当年 爱 因 斯 坦 眼 中 的 以 太一 样 , 令 他 陷入 长 久 的 思考 。 

1949 年 夏天 , 几 个 模糊 的 想法 渐渐 成 熟 。10 月 ,纳什 思 如 泉涌 ,完成 了 属于 他 的 创 
造 一 一 一 个 质疑 亚当 。 斯 密 、 挑 战 冯 。 诺 依 曼 的 新 新 理论 应 运 而 生 。 博 士 生 综合 考试 结 
束 后 几 天 ,纳什 就 带 着 自己 的 理论 成 果 去 拜见 冯 。 诺 依 曼 。 

此 时 的 冯 。 诺 依 曼 伍 然 已 是 一 位 公众 人 物 , 除 了 偶尔 进行 演讲 之 外 ,与 普林斯顿 的 研 
究 生 没有 什么 接触 ,而 且 通 常 也 不 鼓励 他 们 来 请 教 问题 。 他 端 坐 在 一 张 巨 大 的 桌子 旁边 ， 
穿着 昂贵 的 西装 , 打 着 丝 质 领带 ,整个 人 看 上 去 与 其 说 像 个 学 者 , 倒 不 如 说 更 像 一 个 银行 
总 裁 。 他 也 确实 和 公务 繁忙 的 行政 人 员 一 样 操劳 一 -当时 他 担任 着 几 个 顾问 职务 ,还 要 
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没完 没 了 地 和 奥 本 海 默 争论 氢弹 研制 的 问题 ,同时 还 指导 两 台电 子 计 算 机 样机 的 建造 和 
程序 编制 工作 。 

纳什 开始 向 冯 。 诺 依 曼 讲述 自己 的 证 明 。 但 是 , 没 等 他 说 到 结论 , 冯 。 诺 依 曼 便 打 断 
了 他 :“ 你 说 的 不 过 只 是 一 个 不 动 点 定理 而 已 ”纳什 便 终 止 了 谈话 ,默然 离开 了 。 过 了 几 
天 ,纳什 向 他 的 朋友 盖 尔 谈 起 了 他 的 发 现 :“ 我 觉得 我 已 经 找到 了 一 个 办 法 ,可 以 将 冯 。 
诺 依 曼 的 最 大 最 小 定理 普遍 化 …… 整 个 理论 就 是 建立 在 这 个 基础 上 。 无 论 局 中 人 数 多 少 
都 适用 ,也 不 仅仅 限于 零 和 博弈 …… 我 把 这 称 为 一 个 均衡 点 "在 详细 了 解 后 , 盖 尔 意识 到 
纳什 的 想法 能 够 很 好 地 结合 实际 , 远 远 超过 了 冯 。 诺 依 曼 的 零 和 架构 。 然 而 ,更 让 盖 尔 着 
迷 的 是 它 的 优美 。 他 说 :“ 其 中 的 数学 非常 优美 ,在 数学 上 简直 是 太 正确 了 。” 

盖 尔 积极 鼓动 纳什 将 结果 正式 发 表 。 盖 尔 回忆 说 :“ 我 说 这 绝对 是 一 个 了 不 起 的 成 
果 ,应 该 抓紧 时 间 。?" 他 告诉 纳什 ,应 该 抢 在 别人 想到 一 个 类 似 的 主意 之 前 尽快 将 这 个 成 果 
纳入 自己 的 名 下 。“ 纳 什 这 个 人 比较 怪 ,也 许 他 自己 永远 也 想不到 这 么 做 。 因 此 他 把 证 明 
过 程 交 给 我 ”最终 ,纳什 的 成 果 刊 登 在 1950 年 11 月 的 学 院 学 报 上 。 

纳什 敏锐 地 观察 到 : 各 个 参与 者 采取 自己 的 最 优 策略 ,同时 估计 其 他 参与 者 也 将 采 
取 最 优 的 策略 。 但 站 在 所 有 参与 者 的 立场 来 看 ,这 并 不 一 定 就 是 最 优 的 解决 方案 : 璧 如 
“ 因 徒 困境 ”。 这 种 结果 与 经 济 学 中 亚当 。 斯 密 的 “看 不 见 的 手 ” 相 矛盾 。 处 于 博弈 中 的 各 
个 参与 者 都 在 追求 个 人 利益 ,但 他 们 的 行动 不 一 定 会 增进 整个 集体 的 利益 。 现 代 经 济 学 
从 此 开始 注意 到 个 人 理性 和 集体 理性 的 矛盾 与 冲突 。 解 决 这 个 问题 的 办 法 并 不 是 像 传统 
经 济 学 主张 的 那样 , 仅 通过 政府 干预 来 避免 市 场 失调 时 的 无 效 状态 。 我 们 应 该 意识 到 ,如 
果 一 种 制度 安排 不 能 满足 个 人 理性 的 话 ,就 不 可 能 实行 下 去 。 所 以 解决 个 人 理性 与 集体 
理性 之 间 冲 突 的 办 法 不 是 否认 个 人 理性 ,而 是 设计 一 种 机 制 , 在 满足 个 人 理性 的 前 提 下 达 
到 集体 理性 。 

有 了 在 非 合作 博弈 领域 的 创新 发 现 ,纳什 成 功 地 打开 了 将 博弈 论 应 用 到 经 济 学 、 政 治 
学 ,社会 学 乃至 进化 生物 学 的 大 门 。 与 纳什 和 海 萨 尼 分 享 1994 年 度 诺 贝 尔 经 济 学 奖 的 德 
国 经 济 学 家 泽 尔 腾 这 样 说 道 :“ 从 总 体 来 看 ,没有 人 预见 到 纳什 均衡 会 给 经 济 学 和 社会 科 
学 带 来 如 此 深刻 的 影响 ,更 不 必 说 其 对 生物 学 的 重要 意义 。” 

此 外 ,纳什 还 详细 并 述 了 非 合作 博弈 与 合作 博弈 的 区 别 。 简 单 地 说 ,在 合作 博弈 当 
中 ,参与 者 可 以 与 其 他 参与 者 达 成 协议 ,实现 共 赢 。 与 此 相反 ,在 非 合 作 博 弈 当中 ,利益 集 
团 不 会 出 现 ,参与 者 之 间 无 法 互相 妥协 达成 一 致 。 纳 什 的 突破 性 成 果 正 是 从 理论 上 解决 
了 非常 一 般 的 非 合 作 博 弈 ,而 这 恰 是 冯 。 诺 依 曼 和 摩根 斯 坦 所 未 能 求解 的 。 

正如 盖 尔 所 言 , 纳 什 均 衡 简洁 而 优美 一 一 只 要 有 限 个 参与 者 “行动 都 理性 ,信念 都 正 
确 ”, 他 们 就 会 在 菜 个 策略 组 合 上 达到 均衡 , 它 就 是 纳什 均衡 。 


2.2.2 连续 得 益 无 限 策略 时 的 纳什 均衡 


平等 和 效率 (的 冲突 ), 是 最 需要 加 以 慎重 权衡 的 社会 经 济 问题 , 它 在 很 多 的 社会 政策 
领域 一 直 困 扰 着 我 们 。 我 们 无 法 按 市 场 效率 生产 出 馅 饼 之 后 ,完全 平等 地 进行 分 享 。 
一 一 阿 瑟 。 奥 肯 
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上 一 节 定 义 了 纯 策 略 纳什 均衡 。 对 于 常见 的 静态 矩阵 , 画 线 法 是 一 种 求解 纯 策 略 纳 
什 均衡 的 实用 方法 。 但 是 对 于 另 一 类 常见 的 博弈 , 它 却 无 能 为 力 。 在 这 类 博弈 中 ,参与 者 
的 策略 集合 是 无 限 的 ,得 益 则 是 对 应 于 无 限 策略 集合 的 连续 函数 。 这 类 连续 得 益 无 限 策 
略 博弈 常 可 利用 导数 知识 来 找到 纳什 均衡 。 接 下 来 将 通过 3 个 模型 来 说 明 ,并 特别 介绍 
所 用 到 的 一 个 概念 : 反应 函数 。 

1. 古 诺 模型 


引证 故事 


“垄断 ”一 词 源 于 (孟子 》 一 一 必 求 垄断 而 登 之 ,以 左右 望 而 网 市 利 ”, 原 指 站 在 市 集 的 
高 地 上 操纵 贸易 ,后 来 在 经 济 学 上 指控 制 市 场 的 唯一 卖家 。 在 垄断 者 的 市 场 中 , 买 家 人 数 
众多 ,互相 竞争 ,是 价格 接受 者 。 而 卖方 可 以 通过 控制 产品 价格 或 者 产量 ,来 最 大 化 自己 
的 利润 。 

真实 的 市 场 很 少 出 现 只 由 一 个 卖方 礁 断 的 情况 ,通常 会 出 现 由 两 家 或 者 多 家 控制 的 
局 面 , 如 可 口 可 乐 和 百事 可 乐 . 中 国 石油 和 中 国 石化 ,等 等 。 在 经 济 学 中 ,他 们 被 称 为 “ 宕 
头 ”。 由 寨 头 控制 的 市 场 可 称 为 赛 头 市 场 或 赛 头 垄断 市 场 。 

厂商 在 生产 活动 中 需要 决定 两 个 重要 的 指标 ,一 个 是 产量 ,一 个 是 价格 。 同 时 分 析 这 
两 个 变量 有 一 定 难 度 , 让 我 们 先 单独 研究 产量 与 价格 各 自 对 厂商 得 益 的 影响 。 简 言 之 ,与 
产量 决策 相对 应 的 模型 在 经 济 学 中 称 作 古 诺 (Cournot) 模 型 ,而 与 定价 对 应 的 模型 叫 作 伯 
川 德 模型 。 在 这 两 个 模型 中 ,参与 者 的 策略 可 以 在 某 个 范围 内 连续 变化 , 即 他 们 有 无 限 多 
个 可 能 策略 。 在 这 种 条 件 下 ,我 们 依然 能 够 找到 纳什 均衡 , 称 之 为 “无 限 策略 纳什 均衡 ”。 

中 东 地 区 这 个 天 然 的 大 油库 ,地 下 蕴藏 着 全 世界 一 半 以 上 的 石油 ,占有 这 个 地 区 的 国 
家 伊朗 、 伊 拉克 .科威特 、 沙 特 阿拉 伯 等 成 了 石油 察 头 国家 。 这 些 国 家 为 了 获得 更 多 利润 ， 
组 成 了 一 个 联盟 一 一 世界 石油 输出 国 组 织 (Organization of Petroleum Exporting 
Countries,OPEC) 。 他 们 主要 通过 达成 共识 减少 产量 来 提高 石油 价格 。 在 1973 一 1985 
年 间 , 他 们 让 每 桶 原油 的 价格 上 涨 了 十 数 倍 ,共同 搜 取 了 惊人 的 利润 。 经 济 学 家 把 这 类 生 
产 同 质 产 品 的 独立 企业 (石油 国 可 被 视 为 一 个 大 企业 ) 所 构成 的 组 织 称 作 卡特 尔 (cartel)。 
形成 了 卡特 尔 的 市 场 相 当 于 只 有 一 个 垄断 者 。 

寒 头 们 都 希望 能 形成 卡特 尔 , 但 并 不 能 总 是 如 愿 。 原 因 有 二 : 一 是 世界 上 多 数 国家 
的 反 垄 断 法 都 禁止 寒 头 之 间 的 公开 协议 ; 二 是 卡特 尔 成 员 会 受到 利润 的 诱惑 私自 增加 产 
量 , 让 达成 协议 的 努力 付 之 东 流 。 从 历史 发 生 看 , 当 欧 佩 克 对 各 国 石油 产量 和 价格 做 出 统 
一 限定 后 ,各 成 员 国 私下 都 会 多 生产 一 些 石油 来 获得 更 多 的 利润 。 例 如 ,伊朗 多 生产 一 
些 , 伊 拉克 多 生产 一 些 , 其 他 国家 也 都 想 多 生产 一 些 。 如 此 一 来 ,石油 的 实际 产量 就 会 超 
出 共同 协议 的 产量 很 多 ,使 得 油价 低 于 原 定 的 价格 。 

这 也 说 明 守 头 们 在 集体 利益 和 个 人 利益 之 间 有 权衡 与 取 会 。 他 们 都 希望 通过 合作 来 
达成 垄断 ,以 便 共 赢 ,但 是 又 单方 面 地 希望 在 共 赢 的 基础 上 ,自己 可 以 “更 赢 "。 但 是 有 个 
问题 出 现 了 ,既然 增加 产量 后 反而 更 糟糕 ,为 何 大 家 不 能 主动 退回 到 原来 的 协议 产量 呢 ? 


古 诺 模型 又 称 * 古 诺 双 寡头 模型 ,由 法 国 经 济 学 家 古 诺 在 1838 年 提出 。 在 那 时 ,证 
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诺 就 已 提出 了 纳什 所 定义 的 均衡 (但 是 只 局 限 在 特定 的 双 寡头 模型 中 ) 。 因 其 对 博弈 论 的 
突出 贡献 ,他 的 研究 结果 理所当然 地 成 为 博弈 论 的 经 典 文献 之 一 ,同时 也 成 为 产业 组 织 理 
论 的 重要 里 程 碑 。 

在 这 里 ,我们 只 讨论 古 诺 模型 中 最 简单 的 一 种 情况 。 在 之 后 的 章节 里 ,大 家 还 将 看 到 
这 个 模型 的 变形 。 为 了 理解 方便 , 暂 不 使 用 博弈 的 语言 ,而 用 已 有 的 常识 来 描述 这 个 
问题 。 

假设 市 场 中 只 有 两 个 厂家 可 以 生产 某 种 商品 ,分 别 为 A 厂 和 B 厂 。 这 种 商品 的 市 场 
非常 好 ,生产 多 少 就 能 销售 多 少 ( 也 可 以 说 市 场 是 出 清 的 )。 但 消费 者 愿意 支付 的 价格 随 
着 市 场 总 产量 (A 厂 与 B 厂 的 产量 之 和 ) 的 增加 而 减少 。 假设 A 厂 产 量 为 qa,B 厂 产量 为 
gq8， 则 市 场 价格 为 1000 一 (ga 十 gp) 元 。 生 产 每 件 产 品 的 成 本 对 于 两 个 厂家 来 说 是 一 样 
的 ,假定 都 为 100 元 。 那 么 此 时 A 厂 的 收益 应 为 ga X[1000 一 (ga 十 qs) 一 100],B 厂 的 
收益 应 为 qs X[1 000 一 (ga 十 gp) 一 100]。 

假如 A 厂 认为 B 厂 的 产量 已 经 确定 (假设 为 g 吓 ), 则 A 厂 的 收益 函数 是 一 个 二 次 函 
数 。A 为 了 能 在 对 方 生产 嘲 时 自己 获得 最 大 利益 ,由 二 次 函数 的 性 质 ( 求 导 ) 可 知 ,A 厂 
的 产量 ga 应 为 450 一 g 浓 /2。 类 似 地 , 当 A 厂 的 产量 为 gx 时 ,B 厂 的 产量 应 为 qs 二 450 一 
gq /2 才能 最 大 化 自己 的 收益 。 

可 以 想象 两 个 厂商 在 长 期 的 生产 销售 中 不 断 调整 自己 的 产量 ,最 终 达到 稳定 。 此 时 ， 
人 A 厂 的 实际 产量 qa 等 于 gA ; B 厂 的 实际 产量 gs 等 于 gq。 由 于 双方 同时 行动 ,因此 双 
方 的 行动 需要 同时 满足 上 述 函 数 。 于 是 得 到 下 面 的 方程 组 : 


qk 一 450 一 守 - 


解 得 0A 一 300,qB 一 300。 

但 此 时 双方 的 收益 真 的 是 最 大 吗 ? 我 们 简单 算 一 算 : 如 果 双 方 的 产量 均 为 300, 那 么 
他 们 的 收益 均 为 300X[L1 000 一 (300 十 300) 一 100]=90 000; 假如 双方 的 产量 均 为 225， 
那么 他 们 的 收益 均 为 225X[1 000 一 (225 十 225) 一 100] 王 101 250 之 90 000。 这 是 为 什么 
呢 ? 既然 有 策略 组 合 可 以 给 双方 都 带 来 更 好 的 利益 ,为 什么 最 终 没有 达成 呢 ? 这 和 囚徒 
困境 是 否 有 些 相似 呢 ? 

让 我 们 来 详细 地 用 符号 再 建 这 个 模型 。 为 了 区 别 于 前 面 的 叙述 ,重新 给 两 个 参与 者 
起 名 : 企业 1 和 企业 2 。 

令 gl ,qz 分 别 表示 这 两 家 企业 生产 某 一 同 质 产 品 ( 相 似 , 可 替代 的 产品 ) 的 产量 (qi， 
qz 宇 0)。 假 设 没有 其 他 企业 参与 竞争 , 即 市 场 中 该 产品 的 总 供给 : Q=di 十 qz 。 

这 种 产品 的 售 价 与 供给 量 有 关 , 令 PP 表示 价格 ,P 是 关于 Q 的 函数 : 

P(Q) = a 一 Q， a 为 常数 

(更 准确 地 表述 为 当 Q< 和 a 时 ,P(Q)=a 一 Q; 当 Q>a 时 ,P(Q) 二 0.) 

产品 的 总 成 本 与 生产 量 有 关 , 令 C 表示 成 本 ,C 是 关于 g 的 函数 。 设 企业 i 产量 为 
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gi, 则 其 成 本 为 
Gg) 一品: <6 为 常数 

意 即 企业 没有 固定 的 成 本 , 且 两 家 企业 生产 每 单位 产品 的 边际 成 本 (每 一 单位 新 增产 品 带 
来 的 总 成 本 的 增 量 ) 均 为 常数 c。 假 定 c 二 a, 根据 古 诺 的 假定 ,两 家 企业 同时 进行 产量 
决策 。 

回顾 一 下 博弈 的 要 素 : 

参与 者 : 企业 1 和 企业 2。 

策略 集 : 在 古 诺 模 型 中 ,双方 需要 决定 的 是 产量 。 假 设 生产 产品 的 数量 是 连续 可 分 
割 的 非 负 数 , 则 企业 i 的 策略 集 可 表示 为 5S; 二 {gi1gi:E[L0,o0)}。 显 见 , 策 略 si 即 为 产量 
qi。 不 必 担 心 gi 的 可 取 范 围 太 大 一 一 超过 a 的 产量 都 会 使 得 益 为 0, 两 个 厂家 都 不 会 这 
么 做 。 

得 益 : 企业 i 的 得 益 应 为 他 自己 和 另 一 企业 所 选 策略 的 函数 。 假 定 收益 就 是 其 利润 
额 ,这 样 参 与 者 i 的 收益 就 可 以 写 为 

ri(qgi,gi) = giL P(gi+ 9g;)—c] = giLa— (qi gi;)—c] 

根据 纯 策 略 纳什 均衡 定义 ,一 个 策略 s* 如 果 是 纯 策 略 纳什 均衡 ,那么 对 于 每 个 参与 

者 i 来 说 ,si* 应 满足 


Ui(si ,sf ) uil(si,st ) 
上 式 对 任何 属于 Si 的 可 选 策略 s; 都 成 立 , 这 一 条 件 等 价 于 : 对 于 每 个 参与 者 i,s7 
必须 是 下 面 最 优化 问题 的 解 : 


maxui(si,s? ) 


ES, 


在 古 诺 双 寡头 模型 中 ,上 述 条 件 可 具体 化 表述 : 任 给 一 对 产量 组 合 (or ,qz ) , 若 为 纳 
什 均衡 , 则 对 于 每 家 企业 i.gz 应 为 下 述 优 化 问题 的 解 : 
max xi(gi,g? ) = ,ax qi[a— (git+gq? )—c] (3-1) 
; < 和 qi 和 co 


0<g<™ 
设 g7 二 a 一 c<。 显 然 若 不 满足 这 个 不 等 式 ,利润 将 是 负 的 , 稍 后 将 证 明 该 假设 成 立 。 
利用 导数 为 0 或 二 次 函数 求 最 大 值 ,其 解 为 


融和 Ce a 


所 以 ,如 果 产 量 组 合 (g? ,qz ) 是 一 个 纳什 均衡 , 则 企业 的 产量 必须 满足 


gq 一 (a 一 二 1 
E x 
q2 一 可 (4a 一 一 c) 
解 这 组 方程 得 
0 
ql 92 3 


可 见 产 量 小 于 a 一 c, 满 足 假设 条 件 。 代 入 前 例 中 的 a 二 1 000,c 二 100, 可 得 gf = 
gz 二 300。 那 为 什么 这 个 策略 组 合 不 是 最 优 的 呢 ? 
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回顾 前 面 的 式 (3. 1) ,因为 咏 达 0, 所 以 qiLa 一 (qi 十 gq) 一 cj<<qiLa 一 qi 一 cj]。 这 表 
明 , 当 市 场 完全 由 一 个 企业 垄断 的 时 候 , 这 家 企业 的 得 益 才 能 达到 理论 上 的 最 大 值 。 不 妨 


把 一 家 企业 垄断 使 其 利润 最 大 化 的 产量 称 为 “垄断 产量 ”, 即 Co 此 时 它 可 获得 


” 要 _ (a—e)? 
垄断 利润 "xm (gi,0) 二 一 一。 

另外 ,在 市 场 上 只 有 两 家 企业 的 情况 下 ,由 反应 函数 可 以 推 知 ,qi 十 qz 之 gm 恒 成 立 。 
它 说 明 由 于 垄断 产量 较 低 , 相 应 的 市 场 价格 PCqn ) 较 高 。 在 这 种 价格 下 ,每 家 企业 都 有 动 
机 提高 产量 ,而 不 顾 价格 下 降 。 


2. 反应 函数 

用 上 面 的 方法 预测 双方 的 行动 时 ,我 们 曾 得 到 这 样 两 个 式 子 ， 
91 一 (a -wy = (3-2) 
92 一 六 (a 一 9 一 c) (3=3) 


以 式 (3-2) 为 例 ,这 个 式 子 描述 了 当 企 业 2 改变 自己 策略 时 ,企业 1 应 该 如 何 对 其 行 
动 做 出 最 优 反应 。 我 们 称 这 样 的 函数 为 企业 1 对 企业 2 产量 的 一 个 “最 优 反应 函数 ”, 也 
叫 * 反 应 函数 ”。 

图 2-39 做 出 了 两 家 企业 对 彼此 的 策略 的 最 优 反应 函数 。R1 代表 企业 1 的 反应 函数 
(R 是 reaction 的 缩写 ) ,Rs 代表 企业 2 的 反应 函数 。 两 个 最 优 反 应 函数 只 有 一 个 交点 ， 
该 交点 就 是 纳什 均衡 所 对 应 的 产量 组 合 。 

使 用 最 优 反应 函数 时 需要 注意 的 是 反应 函数 必须 连续 。 而 在 很 多 博弈 中 ,参与 者 的 
策略 不 是 无 限 的 ,更 不 是 连续 的 ,因此 各 方 的 得 益 也 不 是 连续 的 可 导 函 数 ,所 以 无 法 通过 
求 导 得 出 反应 函数 。 另 外 ,最 优 反 应 函数 可 能 不 相交 ,或 者 交点 有 多 个 ,这 也 会 带 来 分 析 
上 的 困难 ,如 图 2-40 所 示 。 


O 有 O 
((a-c)/2.0) (a-c.0) qi (a) (b) 


图 2-39 双 寡 头 最 优 反 应 函数 图 2-40 最 优 反应 函数 特殊 情况 


另外 ,无 限 策略 博弈 也 可 以 应 用 反复 剔除 严格 下 策 法 , 感 兴趣 的 读者 可 以 参阅 罗 伯 
特 。 吉 本 斯 (Robert Gibbons) 所 著 的 《博弈 论 基 础 》 相 关 章 节 。 

类 似 古 诺 模 型 这 样 来 分 析 企 业 产量 的 模型 还 有 很 多 。 在 第 3 章 中 还 将 介绍 企业 依次 
决定 产量 的 斯 塔 克 博 格 模型 (1934); 古 诺 模型 中 两 家 企业 的 相互 影响 多 次 发 生 的 吉姆 
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斯 。 弗 里 德 曼 模型 。 

3. 公 地 的 悲剧 

从 工业 革命 开始 ,大 气 中 的 二 氧化 碳 含量 增加 了 近 30%‰; 甲烷 含量 增加 了 两 倍 多 ; 
一 氧化 氮 的 含量 增加 了 15%%。 在 20 世纪 初 ,全 球 近 地 面 平均 气温 上 升 了 约 0. 6%C。 
1951 一 2001 年 ,我 国平 均 地 面 气温 变 暖 幅度 达到 1.1°C ,明显 高 于 同期 全 球 的 平均 增 温 速 
率 。 全 球 海平 面 上 升 了 10 一 20 厘米 …… 

美国 生态 学 家 加 勒 特 。 哈 丁 (Garret Hardin) 曾 于 1968 年 在 (科学 ?杂志 上 发 表 了 一 
篇 题 为 4 公 地 的 悲剧 》 的 文章 。 文 中 介绍 英国 曾经 有 这 样 一 种 土地 制度 一 一 封建 主 在 自己 
的 领地 中 划 出 一 片 尚未 耕种 的 土地 作为 牧场 (他 称 之 为 * 公 地 ”) ,无 偿 向 牧民 开放 。 这 本 
来 是 一 件 造福 民众 的 事 , 但 由 于 是 无 偿 放牧 ,每 个 牧民 都 想 尽 可 能 多 地 养 羊 。 随 着 羊 数量 
无 节制 地 增加 , 公 地 牧场 最 终 因 * 超 载 ?而 成 为 不 毛 之 地 ,牧民 的 羊 也 无 从 放养 。 

这 种 悲剧 背后 的 原因 是 什么 呢 ? 

假设 总 共有 个 牧民 来 这 里 放羊 ,用 gi 表示 牧民 放养 的 头 数 ,那么 整个 牧场 中 羊 的 
总 数量 为 G 二 gi 十 gz 十 … 十 gn。 近 似 假设 羊 的 数量 是 连续 可 分 割 的 ,那么 村 民 的 策略 对 
应 着 放养 的 羊 的 数量 g;:。 因 此 ,可 将 他 的 策略 集 写 作 [0,co)。 

牧民 的 得 益 可 以 用 羊 的 总 价值 减 去 总 成 本 计算 。 购 买 和 照看 一 头羊 的 成 本 为 定 值 
c, 不 随 羊 的 数目 而 变化 。 当 整个 牧场 中 羊 的 总 数量 为 G 时 ,每 头羊 的 价值 为 w(G) 。 由 于 
每 头羊 都 需要 吃 草 ,如 果 牧 划 生 长 的 速度 供 不 上 羊 的 消耗 ,那么 很 快 羊 就 会 无 草 可 吃 。 

简单 起 见 , 假 设 共 有 3 个 牧民 来 放羊 。 每 头羊 的 价值 为 w(G) 王 100 一 G 王 100 一 (81 十 
82 十 83) ,成 本 为 4。 则 3 个 牧民 的 得 益 函 数 分 别 为 

ud 一 gl1[100 一 (81 十 g2 十 gs3)] 一 481 


uz = g2[100 一 (8g1 十 g2 十 gs3)] 一 482 
us 一 83[100 一 (81 十 g2 十 gs3)] 一 483 
仍 假设 羊 的 数量 为 连续 可 分 割 的 ,那么 上 述 得 益 函 数 依然 是 连续 函数 。 求 三 个 牧民 
各 自 对 其 他 两 个 牧民 策略 的 反应 函数 ,可 得 


1 i 
gl = Ri(g2,83) 一 48 一 二 5g2 一 二 8 
81 1(82y83) 8 7 82 一 了 83 


g2 = Rz(g1,g83) 一 48 一斑 g1 一 六 gs 
g3 = Rs(g1,82) = 48 一 去 一 去 
3 个 反应 函数 的 交点 (gi ,g ; ,83 ) 就 是 该 博弈 的 无 限 策略 纳什 均衡 。 具 体 就 是 将 
81.82,83 代入 3 个 反应 函数 , 联 立 可 以 解 得 81 一 82 一 83 一 24。 此 时 羊 总 数 为 72。 
再 将 其 代 和 人 得 益 函 数 ,得 3 个 牧民 的 得 益 xl 一 x2 一 wx3 一 576。 这 是 3 个 牧民 独立 做 出 
选择 时 ,最 大 化 自己 利益 的 结果 。 
假如 3 个 牧民 可 “结盟 ”, 各 自负 责 等 量 的 羊 群 ,情况 会 怎样 呢 ? 此 时 总 利润 将 均 分 给 
3 人 ,所 以 总 利润 最 大 时 ,每 个 牧民 的 利润 也 最 大 。 假 设 此 时 羊 总 数 为 G* , 它 应 等 于 总 
得 益 u 取得 最 大 值 时 G 的 取 值 。 
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& 一 G(100 一 G) 一 4G 一 96 一 G2 
利用 G 取得 最 大 值 的 条 件 ,可 得 


G* 一 48 
将 其 代入 总 得 益 函 数 , 得 a” 二 2304, 即 
hu = = 76 

可 见 每 个 牧民 独立 做 决定 时 ,草地 会 被 过 度 利 用 ,造成 资源 浪费 ,损害 集体 和 个 人 利益 。 

“ 公 地 的 翡 剧 ”更 准确 的 说 法 是 : 无 节制 地 、 开 放 式 地 资源 利用 的 灾难 。 比 如 环境 污 
染 , 由 于 治 污 需要 成 本 ,私人 必定 千方百计 把 企业 成 本 外 部 化 。 这 就 是 赫 尔 曼 。E. 戴 利 
所 称 的 “看 不 见 的 脚 ”".“ 看 不 见 的 脚 ? 导 致 私人 出 于 自 利 不 自觉 地 把 公共 利益 踢 成 碎片 。 
所 以 ,我 们 必须 清楚 一 -一 公 地 的 悲剧 源 于 公 产 的 私人 利用 方式 。 其 实 , 哈 丁 的 本 意 也 在 
于 此 。 事 实 上 ,针对 如 何 防止 公 地 悲剧 , 哈 丁 提 出 的 对 策 是 共同 赞同 的 相互 强制 ,甚至 政 
府 强制 ,而 不 是 私有 化 。 但 是 ,关于 私有 化 是 否 一 定 会 导致 * 公 地 的 悲剧 ,目前 还 存在 争 
议 。 同 时 ,对 于 避免 公 地 悲剧 发 生 的 制度 创新 仍 在 不 断 探索 中 。 


2 扩展 阅读 : 捷克 成 功 实行 大 众 私有 化 ,并 没有 产生 寡头 ! 


苏联 和 原 东 欧 国家 在 20 世纪 90 年 代 初 经 济 转轨 前 ,国有 经 济 在 GDP( 国 内 生产 总 
值 ) 占 比 基 本 都 在 90 听 以上。 在 经 济 转轨 期 ,各 国 分 别 根据 自身 的 实际 情况 进行 了 不 同 
形式 的 国企 私有 化 运动 。 其 中 ,当时 短期 效果 最 好 的 是 捷克 采用 的 “大 众 私有 化 ”, 即 用 类 
似 于 将 所 有 国企 估 值 股票 化 以 后 平分 给 所 有 公民 的 方式 私有 化 。 这 种 私有 化 的 基本 思路 
首先 是 “在 起 点 平等 的 基础 上 找到 最 初 的 所 有 者 ”, 即 全 体 公 民 , 然 后 是 “在 规则 平等 的 基 
础 上 找到 最 终 的 所 有 者 ”, 即 在 一 定时 间 以 后 企业 的 实际 控制 人 。 

捷克 当时 的 做 法 是 ,每 个 年 满 18 岁 的 公民 只 要 在 支付 1035 克朗 的 登记 费 后 就 可 以 
得 到 一 本 含有 1 000 个 “投资 点 ”的 投资 券 。 每 100 点 可 换 3 股 ,每 人 可 获 30 股 , 规 定 只 能 
买 10 家 企业 的 股票 。 这 些 “ 投 资 点 ”全 部 沈 换 成 私有 化 企业 的 股票 后 ,价值 可 达 数 万 克 
朗 。 同 时 政府 把 经 过 估价 分 股 后 的 大 中 型 国有 企业 投入 供 公民 以 投资 券 选 < 购 ”。 

当然 ,过 于 分 散 的 股份 不 利于 企业 的 管理 。 捷 克 又 以 银行 为 基础 成 立 了 总 共 264 家 
投资 基金 。 公 民 可 以 将 投资 点 投入 投资 基金 ,成 为 基金 的 股东 ,而 由 投资 基金 购买 股票 并 
实现 对 企业 的 管理 。 这 种 基于 信托 投资 的 “大 众 私 有 化 ”并 未 引起 财富 的 高 度 集中 。1992 
年 ,最 富有 的 1/10 家 庭 享 有 总 收入 的 20.5%,1996 年 享有 24.5%, 亦 即 最 穷 的 人 收入 为 
人 均 收 入 的 近 一 半 , 最 富 的 人 收入 比 人 均 收入 高 1 倍 多 。 罕 头 并 不 存在 。 而 同期 捷克 的 
经 济 也 在 稳定 增长 ,被 称 为 “捷克 奇迹 ”。 

与 捷克 的 “激进 ”的 “大 众 私有 化 ? 相 比 , 俄 罗斯 所 采取 的 “大 众 私有 化 ”手段 稍 有 区 别 。 
首先 捷克 的 每 次 私有 化 浪潮 中 上 市 企业 股票 总 值 都 经 过 精心 估价 ,使 其 精确 地 等 于 私有 
化 证 券 的 总 价值 ,同时 这 两 种 价值 都 不 直接 用 货币 单位 ,而 用 "投资 点 ”这样 的 约定 单位 来 
表示 。 而 俄罗斯 的 私有 化 证 券 与 上 市 企业 资产 价值 都 用 卢布 表示 ,但 证 券 价值 与 实际 资 
产 价 值 完全 脱钩 ,这 就 容易 导致 私有 化 证 券 本 身 的 买卖 中 和 以 证 券 " 购 买 ?股票 的 过 程 中 
发 生 投机 风潮 。 
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其 次 ,捷克 的 私有 化 证 券 是 记名 账户 ,俄罗斯 的 私有 化 证 券 则 是 无 记名 支票 ,因此 尽 
管 俄 政 府 呼吁 居民 不 要 着 急用 手中 的 支票 换 现 金 , 而 应 当 等 着 换 股 票 , 然 而 由 于 股市 的 混 
乱 与 信息 不 对 称 , 居 民 很 难 换 到 足以 保值 .增值 的 股票 ,加 之 支票 又 不 记名 ,便于 转手 , 因 
此 实际 上 相当 一 部 分 证 券 还 是 被 轻易 地 卖 掉 “ 换 酒 喝 了 ”。 

最 后 ,对 于 作为 投资 中 介 而 在 证 券 私 有 化 成 败 中 起 关键 作用 的 投资 基金 ,捷克 的 监管 
很 严 , 各 基金 运作 较 规 范 。 而 俄罗斯 的 监管 则 搞 得 很 差 , 以 至 于 基金 会 作 拳 、 诈 骗 案 屡屡 
出 现 ,严重 损害 了 持 券 公民 的 利益 。 


4. 伯 川 德 赛 头 模型 * 

在 我 们 的 认识 中 ,厂商 应 该 既 决 定 产量 ,又 决定 价格 。 但 是 ,消费 者 的 需求 函数 意味 
着 两 个 变量 间 有 明确 的 关系 ,所 以 我 们 可 以 近似 认为 厂商 是 先 选择 了 其 中 一 个 变量 (产量 
或 价格 ) ,然后 再 根据 市 场 来 调整 男 一 个 变量 的 取 值 。 所 以 ,在 古 诺 模 型 里 ,厂商 选择 产量 
是 合理 的 。 下 面 我 们 来 探讨 男 一 种 情况 一 一 厂商 决定 价格 的 伯 川 德 模型 ,也 叫 伯 川 德 双 

如 果 企 业 1 和 企业 2 分 别 选择 价格 p! 和 价格 pz。 消 费 者 对 企业 1 的 需求 为 

qi(pi,p2) = a—pit+bps 
消费 者 对 企业 2 的 需求 为 
gz2(p1i,p2) =a—p2+opi 

其 中 a 和 4 是 正 值 的 常数 (准确 地 说 4 二 2 时 才 有 意义 )。 这 个 式 子 很 精妙 地 反映 了 需求 
的 特点 : 提高 价格 ,顾客 不 想 买 你 的 产品 ; 另 一 家 价格 下 降 , 你 的 销量 也 会 减少 。 

和 所 有 博弈 分 析 相 同 ,我 们 需要 先 明确 参与 者 的 策略 集 以 及 得 益 。 参 与 者 的 策略 通 
过 所 定 的 价格 体现 。 注 意 ,不 能 说 规定 的 “价格 "是 “策略 “规定 某 一 价格 "这 种 行动 才 是 
“策略 ”。 由 于 负 的 价格 没有 意义 ,所 以 每 家 企业 都 可 以 把 任何 非 负数 作为 产品 的 定价 。 
用 S; 二 [0,2) 表 示 企 业 i 的 策略 集 ,s;€S;。 显 然 策略 s; 即 为 定价 Pi。 

依然 假设 每 家 企业 的 得 益 函 数 为 利润 函数 ,市 场 出 清 , 则 当 企 业 i 选择 价格 pi;, 其 对 
手 选择 价格 p; 时 ,企业 i 的 利润 xi(pi,pj) 为 

Ani(pispi) = qi(pis pi) (Pi—o) = (a—pitbp;)(pi— oe) 

其 中 成 本 < 为 非 负 常数 ,因此 (pi 一 疏 表 示 每 件 产品 的 利润 。 

如 果 价 格 组 合 {p; ,p; ) 是 纳什 均衡 , 则 对 每 家 企业 i,p; 应 是 下 面 最 优化 问题 的 解 : 

max xi(pi,p;) max (a—pit+bp;)(pi— ce) 


0o< 户 二 co 0<p,<o 
不 难 解 得 

p? 一 去 (十 如; 二) 
因此 ,两 家 企业 选择 的 价格 应 满足 

2 = 于 Ce 十 态 ; 4+e) 


BE (a top? ey 
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解 这 一 组 方程 ,可 得 
并 一 好 一 2 
正如 上 文 所 提 及 的 , 仅 当 2<2 时 ,这 个 问题 才 有 意义 。 这 样 我 们 便 求 得 了 伯 川 德 寞 
头 模型 中 的 无 限 策略 纳什 均衡 。 


2.3 混合 策略 纳什 均衡 


2.3.1 混合 策略 


假如 今 晚 恰好 同时 有 NBA 总 决赛 和 世界 杯 决赛 ,你 最 喜欢 的 篮球 队 和 足球 队 都 将 
角逐 冠军 ,你 该 怎么 办 呢 ? 虽然 博弈 的 参与 者 只 有 你 一 个 人 ,但 此 时 想 看 NBA 的 动机 和 
想 看 世界 杯 的 动机 正在 进行 激烈 的 斗争 。 从 博弈 的 角度 看 ,无 论 看 哪 场 比赛 ,都 将 给 你 带 
来 极 大 的 满足 ,可 以 视 选 择 这 两 种 策略 的 得 益 相 等 。 两 个 策略 同样 棒 , 且 没有 更 好 的 策 
略 ,也 就 是 说 : 纯 策 略 纳什 均衡 不 存在 。 那 么 该 怎么 办 ? 

有 人 说 :“ 抛 硬币 1” 

这 是 不 能 两 全 其 美的 无 奈 之 举 , 但 确实 能 解决 问题 。 抛 硬币 实际 上 是 利用 道具 ,将 
50% 的 概率 赋 给 “看 NBA”,50% 的 概率 赋 给 “看 世界 杯 ”?。 这 样 就 形成 了 一 个 “混合 策 
略 ”。 

回顾 2. 1. 4 节 , 参 与 者 的 一 个 混合 策略 是 指 他 可 采取 的 一 种 “根据 概率 分 布 对 策略 进 
行 选择 ”的 行动 。 可 见 , 混 合 策略 是 纯 策略 在 空间 上 的 概率 分 布 ; 纯 策 略 是 混合 策略 的 特 

本 节 将 重点 讨论 * 非 退化 的 混合 策略 ”, 即 * 不 是 纯 策 略 的 混合 策略 ”。 同 时 ,本 节 会 将 
纯 策略 分 析 中 的 * 占 优 ”与 “最 优 反 应 ”的 概念 完整 地 推广 到 混合 策略 中 来 ,并 由 此 对 混合 
策略 中 的 纳什 均衡 进行 分 析 。 

1. 混合 策略 下 的 占 优 

让 我 们 先 通过 掷 硬 币 博弈 的 例子 来 引入 混合 策略 中 占 优 的 概念 。 假 如 有 两 个 人 参与 
博弈 ,一 个 人 选 好 正 反 后 ,将 其 盖 在 桌 上 ,由 另 一 人 来 猜 。 博 弈 如 图 2-41 所 示 。 

猜 硬币 方 
正面 反面 


正面 | 旦 下 


盖 硬 币 方 


反面 1,-! -1，1 
图 2-41 猜 硬币 博弈 


用 画 线 法 进行 分 析 , 如 图 2-42 所 示 。 
对 于 如 何 选择 , 猜 硬币 方 完 全 没有 头绪 ,无 论 选择 哪 种 策略 结果 似乎 都 是 一 样 的 。 也 
许 参与 者 会 在 “ 正 ”“ 反 ”二 者 中 随机 选择 , 意 即 二 者 各 占 50% 的 可 能 。 但 是 ,假如 盖 硬 币 
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正面 = 二 


盖 硬 币 方 


图 2-42 ” 画 线 法 分 析 猜 硬币 博弈 


的 一 方 根据 多 年 和 对 方 相处 的 经 验 ,知道 对 方 更 喜欢 猜 * 正 ”, 概 率 达 60% ,而 且 对 方 并 不 
自 知 ,那么 情况 将 会 有 所 改变 。 对 盖 硬 币 者 来 说 ,更 多 次 地 将 硬币 反面 向 上 ,可 以 带 来 更 
大 的 得 益 。 毫 无 疑问 ,出 * 正 ”的 概率 将 低 于 50%。 但 是 ,到 底 为 多 少 才 是 理性 的 呢 ? 

在 上 述 猜 硬币 博弈 中 ,作为 盖 硬 币 方 , 他 根据 自己 的 判断 形成 了 对 对 手 的 信念 。 基 于 
信念 ,选择 “正面 "策略 的 期 望 收益 为 : 对 方 选择 “正面 "的 概率 X 对 方 选 “ 正 面 " 时 我 方 出 
“正面 "的 得 益 十 对 方 选 “ 反 面 "的 概率 X 对 方 选 “反面 "时 我 方 出 “正面 "的 得 益 。 可 用 符号 
简洁 表示 为 

Wi = pie “Ai(iE J 正 ) 十 pjs “XAi(i 反 ,J 反 ) 60% X (—1)+40% Xl1 0.2 
此 时 将 对 手 的 “信念 "引入 了 公式 ,并 赋 上 我 们 认为 的 概率 : 60% , 即 前 文中 的 y 闫 ( 正 ) 三 
60%。 此 时 猜 硬币 博弈 如 图 2-43 和 图 2-44 所 示 。 

狂 硬 币 方 
正面 (60%) 反面 (40%) 
正面 | 回 ,， | 0g, -1 


反面 | 1 ,-! | -1 ，1 


盖 硬 币 方 


图 2-43 猜 硬 币 得 益 和 矩阵 
同 理 , 盖 硬币 方 选择 “反面 的 期 望 收益 为 


wi 60% X1 十 40% X (一 1) = 0.2 


猜 硬币 方 
正面 (60%) 反面 (40%) 


反 


图 2-44 猜 硬币 得 益 矩 阵 


显然 0. 2 盖 一 0.2。 对 盖 硬 币 方 来 说 “反面 ?策略 优 于 * 正 面 ?策略 ,是 一 个 占 优 策略 。 
所 以 要 想 获 得 更 高 的 得 益 , 应 更 多 地 盖 “ 反 面 *。? 


@ 要 小 心 的 是 ,对 手 在 几 个 回合 后 很 可 能 会 发 现 这 个 把 戏 ,而 调整 自己 的 策略 。 而 此 时 盖 硬 币 方 的 信念 也 应 随 
之 变化 。 我 们 将 在 第 6 章 继续 讨论 这 个 问题 。 
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2. 混合 策略 下 的 最 优 反应 
此 前 我 们 只 介绍 了 纯 策略 条 件 下 的 最 优 反应 。 这 个 概念 同样 可 以 推广 到 混合 策略 


中 , 举 一 个 抽象 的 例子 。 

在 图 2-45 博弈 中 ,假设 参与 者 1 的 策略 集 为 (U,M,D)?。 他 的 信念 是 : 参与 者 2 有 
1/3 的 概率 选择 策略 “L”(left) ,1/2 的 概率 选择 策略 “C”(center),1/6 的 概率 选择 策略 
“R”(right) 。 


参与 者 2 
L(1/3) CI2) R(1/6) 
2,6 | 0,4 | 4,4 


ss 


参与 者 1 M 253 


» 


vi 


图 2-45 抽象 博弈 得 益 和 矩阵 


如 果 参 与 者 1 选择 策略 “U”, 他 的 期 望 得 益 为 


十 X2 十 二 X0 十 十 X4 一 总 
如 果 选 择 策略 "M”, 他 的 期 望 收益 为 
二 X3 十 十 X0 二 二 x1= 卫 
如 果 采 取 策 略 “D”, 他 的 期 望 收益 为 
村 X1 十 去 X3 十 言 x2 一 站 
所 以 ,他 的 最 优 反应 是 策略 *D”。 我 们 可 以 用 下 述 方 法 来 规范 地 描述 ， 
se 


意 即 ( 计 , 广 ,二 ) 这 样 概率 分 布 的 信念 ,对 应 的 最 优 反应 为 D。 

仍 以 该 博 守 为 例 , 假 设 这 次 的 身份 是 参与 者 2。 参与 者 2 相信 对 手 有 1/2 的 概率 会 
采取 策略 *U",1/4 的 概率 采取 策略 "M”,1/4 的 概率 采取 策略 “D"。 

那么 若 参与 者 2 采取 策略 *L”, 他 的 期 望 得 益 为 


放生 溉 2 中 王 光 业 三 志 


2 4 4 
如 果 选 择 策略 “C”, 他 的 期 望 收益 为 

1 1 | 13 

元 X4 十 天 X0 十 示 X5 一 也 


如 果 采 取 策 略 “R”, 他 的 期 望 收益 为 


@ 分 别 代 表 “up”*middle”*down”。 
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1 1 i ee 
2 X 4 十 贡 六 办 二 4 X3 4 

所 以 在 这 个 信念 下 ,参与 者 具有 两 个 最 优 反 应 , 即 策略 “L2” 和 策略 “R”。 因 此 
BRz ( 立 ,地 十)= {L,R) 


读者 不 妨 回 顾 一 下 2. 1. 4 节 中 最 优 反应 的 正式 定义 ,检验 一 下 自己 的 理解 。 


曲 概念 解读 


混合 策略 的 最 优 反应 可 以 是 混合 策略 吗 ? 
可 以 , 当 对 方 的 混合 策略 不 确定 时 ,我 们 就 应 以 一 个 混合 策略 来 回应 ,之 后 我 们 会 看 
到 实例 。 


2.3.2 混合 策略 纳什 均衡 
在 前 一 个 例子 中 可 见 ,在 参与 者 1 对 参与 者 2 的 信念 下 ,参与 者 1 选择 纯 策略 D。 这 
样 看 来 ,参与 者 2 的 信念 ( 雪 , 十 ,十 ) 不 对 ,需要 调整 。 而 这 又 将 进一步 改变 参与 者 1 的 


信念 …… 最 终 想 要 达成 均衡 ,双方 的 信念 都 会 调整 正确 ,双方 的 行动 都 将 是 最 优 反 应 。 这 
种 情况 下 的 均衡 正 是 混合 策略 纳什 均衡 。 

我 们 知道 , 纯 策略 下 的 占 优 和 最 优 反 应 的 概念 都 可 以 通过 计算 期 望 的 方式 ,扩展 到 混 
合 策略 中 来 。 那 么 ,纳什 均衡 是 否 可 以 通过 相似 的 方法 得 以 拓展 ? 

回顾 此 前 给 出 的 纳什 均衡 的 定义 , 它 保证 了 每 一 参与 者 的 纯 策 略 都 是 其 他 参与 者 纯 
策略 的 最 优 反应 。 想 一 想 ,任何 纯 策略 都 是 特殊 的 混合 策略 ,要 想 把 2. 2 节 的 定义 推广 到 
包含 混合 策略 的 情况 ,只 需 使 每 一 参与 者 的 混合 策略 是 其 他 参与 者 混合 策略 的 最 优 反应 。 
这 样 扩展 后 的 定义 完全 涵盖 了 前 一 定义 。 

定义 2.7( 混 合 策略 纳什 均衡 ) 考虑 策略 组 合 o 王 (0o1,02，… ,on) ,其 中 对 于 每 一 个 参 
与 者 i, 都 有 GiEASi。 当 且 仅 当 ui(0i,o-i) 之 ui(siwo-i) 对 于 任何 sf € Si; 和 每 一 个 参与 者 
i 都 成 立时 ,组 合 o 是 一 个 混合 策略 纳什 均衡 。 

根据 定义 可 以 看 出 ,策略 组 合 是 一 个 混合 策略 纳什 均衡 ,也 就 意味 着 ,对 每 一 个 参与 
者 来 说 都 是 最 优 反应 。 要 让 一 个 混合 策略 成 为 最 优 反应 ,这 个 混合 策略 中 包含 的 概率 为 
正 的 纯 策 略 必须 是 属于 最 优 反应 的 纯 策略 。2 

总 之 ,无 论 混合 策略 还 是 纯 策 略 ,所 构成 的 策略 组 合 都 有 可 能 是 一 个 纳什 均衡 。 纳 什 
均衡 具有 很 强 的 普 适 性 ,可 以 用 一 个 定理 进行 概括 。 

定理 2.1( 纳 什 定理 ,1950) 在 一 个 用 个 参与 者 的 博弈 G 二 {S1,*… ,Sn; wl， ,Un} 
中 ,如 果 nn 是 有 限 的 , 且 对 每 个 i,S; 都 是 有 限 的 , 则 该 博弈 至 少 存在 一 个 纳什 均衡 ,但 可 
能 包含 混合 策略 。 


中 注意 ,定义 中 是 与 每 个 纯 策略 相 比 ,而 不 是 与 其 他 所 有 混合 策略 相 比 ,这 是 充分 条 件 。 因 为 ,如 果 存 在 其 他 混 
合 策略 比 均衡 策略 带 来 的 得 益 更 高 ,那么 一 定 有 某 个 纯 策 略 同样 比 均衡 策略 带 来 的 得 益 更 高 。 
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通俗 地 说 ,这 个 定理 的 含义 就 是 : 任何 有 限 博弈 都 有 至 少 一 个 混合 策略 纳什 均衡 。 

该 定理 的 证 明 要 用 到 不 动 点 定理 ,不 在 本 书 所 讲 范围 之 内 , 感 兴趣 的 同学 可 自行 查阅 
相关 资料 。 而 且 , 更 进一步 的 结论 是 : 

在 博弈 论 领域 里 几乎 所 有 有 限 策 略 的 博弈 都 有 有 限 奇 数 个 纳什 均衡 。 

这 就 意味 着 ,如 果 一 个 博弈 有 两 个 纯 策 略 纳什 均衡 ,那么 就 一 定 存 在 第 三 个 混合 策略 
的 纳什 均衡 。 亦 即 ,对 于 大 多 数 双 均衡 博弈 问题 ,都 应 该 有 一 个 混合 策略 纳什 均衡 。 这 对 
于 求解 纳什 均衡 具有 非常 重要 的 指导 意义 。 


2.3.3 应 用 举例 : 如 何 让 对 手 猜 不 透 


< 案例 分 析 : 世界 杯 决赛 中 的 点 球 大 战 


2006 年 的 世界 杯 决 赛场 上 ,经 过 120 分 钟 的 苦战 ,法 国 和 意大利 进入 了 点 球 大 战 。 
一 番 点 球 激战 后 ,意大利 4:3 领 先 。 现 在 意大利 球员 法 比 奥 。 格 罗 索 站 在 球门 前 , 面 对 
严阵以待 的 法 国门 将 法 比 安 。 巴 特 斯 。 

格 罗 索 起 脚 , 球 如 火箭 般 冲 进 球门 右 角 ,而 巴特 斯 扑 向 了 另 一 边 , 如 图 2-46 所 示 。 

意大利 球员 欢呼 状 跃 ,而 法 国 球员 重头 才气 , 脸 上 写 满 了 失望 和 难以 置信 。 

视频 2-1: 世界 杯 中 的 点 球 大 战 


图 2-46 格 罗 索 射门 


比赛 考验 的 是 巴特 斯 和 罚 点 球 的 格 罗 索 两 个 人 的 心理 。 格 罗 索 会 向 哪 边 踢 ,而 巴特 
斯 会 扑 向 哪 边 ? 让 我 们 尝试 利用 所 学 知识 ,给 点 球 建立 一 个 简易 的 博弈 模型 。 简 单 起 见 ， 
假设 格 罗 索 可 以 选择 往 左 .中 、 右 三 个 方向 罚球 ,巴特 斯 可 以 选择 往 左 扑 、 站 着 不 动 或 往 右 


扑 ( 为 了 一 致 ,也 称 划 


为 左 、 中 、 右 )。 为 便于 分 析 , 让 我 们 以 格 罗 索 的 视角 确定 左右 , 即 巴 


特 斯 扑 向 他 自己 的 右 侧 视 为 : 选择 策略 * 左 ”。 这 里 我 们 提供 了 一 种 评估 得 益 大 小 的 新 思 
路 一 一 假设 进 球 带 来 的 得 益 为 1 .我 们 可 以 以 进 球 的 概率 来 衡量 每 种 情况 下 格 罗 索 和 巴 
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特 斯 的 得 益 ,博弈 如 图 2-47 所 示 。 


巴特 斯 
左 中 右 
左 65% ，35% | 95% ,5% | 95% ，5% | 
格 罗 索 中 | 95% ,5% | 0% ,100% | 95% ，35% | 
右 95% ,5% 95% ，5% 65% ，35% 


图 2-47 点 球 大 战 得 益 和 矩阵 


很 明显 这 个 博弈 没有 纯 策略 纳什 均衡 。 可 以 这 么 理解 , 格 罗 索 往 哪 边 踢 , 巴 特 斯 也 得 
往 同样 的 方向 扑 才 能 最 大 化 得 益 ; 但 格 罗 索 不 这 样 想 ,他 一 定 不 希望 和 巴特 斯 的 策略 相 
同 , 因 此 不 可 能 有 某 个 策略 组 合 能 使 双方 都 满意 。 换 言 之 ,这 个 博弈 不 存在 稳定 的 纯 策 略 
纳什 均衡 。 

假设 格 罗 索 踢 球 的 混合 策略 为 : 向 左 踢 概率 为 ki(k 为 kicker 的 首 字母 ,1 表示 left)， 
向 中 踢 概 率 为 ke(c 表示 center) ,向 右 踢 的 概率 为 kr(r 表示 right)。 同 样 地 ,假设 巴特 斯 
往 左 扑 的 概率 为 g1(g 表示 goalkeeper) , 守 在 原 地 概率 为 ge, 往 右 扑 概率 为 g:。 显 然 : 
kl 十 ke 十 kt 二 1,gl 十 ge 十 gr 二 1。 

这 样 我 们 可 以 表示 出 格 罗 索 和 巴特 斯 的 期 望 得 益 。 以 格 罗 索 为 例 , 向 左 踢 的 期 望 
得 益 : 


glX65%++ge XI95%++gr X95% 
=gl X65%++(1—g—gr) X95%+gr X95% 
一 0. 95—0.3g1 
向 中 踢 的 期 望 得 益 : 
gl XI95%++(1—g—gr) X0%% 十 grX95%% 
一 0.95(81 十 gr) 
向 右 踢 的 期 望 得 益 : 
Eg1X95% 二 (一 gi—gr) X95%+gr X65% 
=0. 95— 0.3gr 
为 了 应 对 格 罗 索 ,巴特 斯 需要 找 出 一 个 混合 策略 , 即 扑 向 每 个 方向 的 概率 。 对 巴特 斯 
来 说 ,他 要 做 的 是 滴水 不 漏 ,尽量 不 给 对 方 创造 获得 更 高 得 益 的 机 会 。 换 言 之 ,不 能 让 对 
方 发 现 往 左 踢 、 往 右 踢 或 者 往 中 踢 有 可 能 带 来 更 高 的 得 益 。 假 如 有 这 样 的 好 事 ,理性 的 格 
罗 索 一 定 会 把 握 住 的 。 因 此 巴特 斯 最 好 的 应 对 方式 ,是 决定 自己 的 混合 策略 ,使 得 对 方 无 
论 采 取 何 种 策略 产生 的 期 望 得 益 都 相等 , 即 
0.95—0.3g1 = 0.95(gl+ gr) = 0.95—0.3gr 
很 容易 解 出 : gl 一 gr 一 43.18% 43% ,那么 ge 二 (1 一 g1 一 gr) 守 14%。 
因此 ,巴特 斯 的 混合 策略 纳什 均衡 应 该 为 (43%,14%,43%)。 只 有 这 样 , 格 罗 索 才能 
随机 地 做 出 选择 。 也 可 以 说 ,只 有 这 样 , 格 罗 索 才 没 有 占 优 策略 。 
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同样 地 ,我 们 也 可 以 从 格 罗 索 的 角度 分 析 问 题 一 格 罗 索 的 混合 策略 也 应 该 使 得 巴 
特 斯 等 概率 地 在 三 种 策略 中 做 出 选择 。 解 方程 组 ,结果 是 一 样 的 : 
= kr = 43% 


ke = 14% 
不 仅 足球 ,其 他 运动 也 是 如 此 ,在 技术 之 外 需要 策略 的 辅助 ,才能 更 好 地 掌控 比赛 , 获 
得 胜利 。 请 问 ,你 能 找到 更 多 的 案例 来 说 明 如 何 才能 "让 对 手 猜 不 透 " 吗 ? 


2 扩展 阅读 


无 论 在 国内 还 是 在 国外 ,都 存在 多 家 足球 数据 提供 商 ,如 国际 的 “OPTA” 和 国内 的 
“ 创 冰 ” 等 。 只 要 数据 足够 完备 ,一 个 球员 所 在 的 团队 就 能 够 迅速 为 教练 或 球员 提供 决策 
支持 。 例 如 ,在 2014 年 巴西 世界 杯 时 ,BBC 曾 对 本 届 和 以 往 的 点 球 数 据 进 行 了 分 析 。 在 
以 往 历届 世界 杯 当 中 ,6.3% 的 点 球 射 高 或 者 击 中 门框 。 如 果 能 够 将 球 罚 向 左右 上 角 , 基 
本 就 可 以 命中 ; 而 射 低 球 却 无 法 保证 破门 。 本 届 世 界 杯 中 ,门将 们 对 于 罚 向 球门 中 路 的 
低 球 扑 救 成 功率 较 高 ,此 外 ,他 们 向 右 扑 的 成 功率 要 高 于 向 左 扑 。 而 在 2014 年 世界 杯 中 ， 
球员 右 脚 罚球 25 次 ,8 次 罚 丢 ,成 功率 68%; 左 脚 罚球 11 次 ,2 次 罚 丢 ,命中 率 82%。 当 
然 , 这 只 是 BBC 公开 的 一 部 分 数据 而 已 。 实 际 上 ,通过 服务 商 所 提供 的 数据 ,球员 还 可 以 
看 到 对 手 的 更 详尽 分 析 。 


2.3.4 求解 混合 策略 纳什 均衡 


本 小 节 通 过 一 个 数值 例子 给 出 求解 混合 策略 纳什 均衡 的 一 般 解法 。 在 某 些 工作 场 
合 , 职 员 的 工作 努力 程度 是 不 容易 被 观察 到 的 ,因此 职员 既 有 可 能 偷懒 也 有 可 能 勤奋 。 而 
经 理 则 有 检查 和 不 检查 两 种 选择 。 假 如 职员 和 经 理 面 临 如 下 的 博弈 局 面 ( 见 图 2-48) 。 

根据 画 线 法 可 知 该 博弈 没有 纯 策略 纳什 均衡 ,因此 考察 混合 策略 纳什 均衡 ((p,1 一 
Pp),(q,1 一 q)}。 为 了 直观 ,在 静态 矩阵 中 加 入 每 个 行动 的 概率 ,如 图 2-49 所 示 。 


经 理 
经 理 检查 q 不 检查 1-9 
检查 不 检查 
如 10,80 8, 100 ] | 医 D 
职员 职员 
偷 侧 |_6.90 | 10,60 | 偷懒 1-p | 6. 9%0 
图 2-48 职员 和 经 理 的 博弈 矩阵 图 2-49 职员 和 经 理 的 博弈 矩阵 


方法 一 。 根据 让 别人 猜 不 透 的 原则 ,经 理 选择 g 使 得 职员 猜 不 透 。 换 言 之 ,经 理 的 策 
略 使 得 职员 在 勤奋 与 偷懒 之 间 无 从 选择 。 因 此 职员 选择 勤奋 和 偷懒 时 的 期 望 值 应 该 是 一 
样 的 。 所 以 ,有 

qxX10+(1—g) Xx8=gXx6+(1—g) X10. 

同 理 , 职 员 的 选择 使 得 经 理 猜 不 透 , 意 即 经 理 在 检查 和 不 检查 之 间 无 从 选择 。 因 此 ， 

经 理 在 选择 检查 和 不 检查 时 的 期 望 得 益 也 是 一 样 的 ,有 
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pxX80+(1—p) X90=px100+(1—p) X60. 
两 式 联 立 可 解 得 : p 一 羡 ,q 一 于。 所 以 ,经 理 以 1/3 的 概率 抽查 ,而 职员 则 依照 3/5 


的 可 能 性 选择 勤奋 。 

方法 二 。 如 果 经 理 选 择 混合 策略 (gq,1 一 g), 则 职员 选择 勤奋 时 的 期 望 得 益 为 gq X 
10 十 (1 一 gq) X8。 若 职员 选择 偷懒 , 则 期 望 得 益 为 aX6 十 (1 一 g) X10。 所 以 ,职员 选择 混 
合 策略 (p ,1 一) 时 的 期 望 得 益 为 

Ui= pLlqgxX10+(1—g) Xx8]+(1—p)[Lgx 6+(1—g) x 10]. 
同 理 , 经 理 的 期 望 得 益 为 
Us = gLp X80+(1—p) X90]+(1—q)[p X100+(1— p) X60]. 

所 以 ,职员 选择 p 使 得 Ul 最 大 ,同时 经 理 选择 g 使 得 Uz 最 大 。 由 于 p 和 g 在 [0,1] 

内 连续 , 须 有 


dUl _ 

| 
| 墅 =。 
q 


亦 即 
[X10+(1—qg)X8=gqX6+(1—gq) X10 


lpx go +H(1—p) X90= px100+(1—p) x60 
实际 上 ,这 就 是 方法 一 的 结果 。 同 样 解 得 6 一 写 ,9= 辣 。 


2.4 关于 均衡 的 更 多 讨论 


研究 纳什 均衡 时 ,我 们 发 现 了 一 些 有 意思 的 现象 : 聪明 的 办 徒 得 不 到 最 好 的 收益 , 夫 
妻 之 争 经 常 能 达成 一 致 。 这 背后 一 定 有 某 些 规律 在 左右 人 们 对 策略 的 选择 。 经 济 学 家 们 
敏锐 地 发 现 了 这 些 问 题 ,并 循 着 问题 找到 了 一 系列 普遍 适用 的 重要 规律 。 本 节 我 们 一 起 
来 看 经 济 学 家 们 如 何 进 一 步 完善 均衡 理论 ,将 博弈 论 发 展 到 一 个 新 高 度 。 


2.4.1 集体 理性 与 帕 累 托 上 策 均衡 


1. 集体 理性 和 效率 

回顾 囚徒 困境 ,其 得 益 和 矩阵 如 图 2-50 所 示 ,两 个 聪明 人 如 果 都 选择 沉默 ,会 少 蹲 几 年 
监狱 ,可 是 他 们 因为 担心 对 方 “ 背 叛 ”, 而 选择 “坦白 ”。 就 他 们 两 人 而 言 ,这 种 对 个 人 利益 
的 担心 导致 了 集体 利益 的 损失 。 

是 否 可 以 据 此 认为 他 们 不 理性 呢 ? 不 .问题 不 是 出 在 是 否 理性 上 ,而 是 出 在 决策 模式 
上 , 即 做 决策 时 参与 者 的 行为 动机 到 底 是 什么 。 因 此 ,经 济 学 家 们 提出 了 “追求 集体 利益 
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囚徒 乙 
沉默 坦白 
nm | -2:2 | =.0 
坦白 | 0 ,-9 | = 


图 2-50 囚徒 困境 得 益 矩 阵 


最 大 化 ”2 的 集体 理性 概念 。 

在 这 种 新 的 前 提 下 ,此 前 定义 的 “ 占 优 ” 不 再 适用 了 ,因为 占 优 描 述 的 是 一 种 “无 论 别 
人 如 何 只 要 自己 最 好 就 行 " 的 思想 。 显 然 想 采取 占 优 策略 的 人 不 具有 集体 理性 。 因 此 我 
们 需要 一 种 类 似 于 “ 占 优 ” 这 一 概念 的 、 适 用 于 集体 理性 的 标准 ,来 衡量 各 种 策略 的 优 劣 。 

经 济 学 家 维尔 弗 雷 多 。 帕 累 托 (Vilfredo Pareto) 最 先 引 入 了 “效率 ”这 一 概念 ,这 一 
概念 后 来 也 被 称 作 * 帕 累 托 效率 ”, 或 称 * 帕 累 托 最 优 ”。 

按照 帕 累 托 的 说 法 “如 果 社 会 资源 的 配置 已 经 达到 这 样 一 种 状态 : 要 想 让 某 个 社会 
成 员 变 得 更 好 ,就 只 能 让 其 他 某 个 成 员 的 状况 变 得 比 现在 差 ; 如 果 不 让 某 个 人 状况 变 差 
就 不 能 让 任何 人 变 得 更 好 。 此 时 ,这 种 资源 配置 的 状况 是 最 佳 的 ,是 最 有 效率 的 。” 

用 数学 语言 来 表述 ,如果 ui(s) 三 ui(s') 对 每 个 参与 者 i 都 成 立 , 同 时 不 等 式 至 少 对 一 
个 参与 者 是 严格 成 立 的 ,那么 比 y 更 有 效率 。 如 果 不 存在 其 他 更 有 效率 的 策略 组 合 ,我 
们 称 这 个 策略 组 合 是 有 效 的 。 其 中 “有 效 " 的 定义 如 下 : 如 果 对 每 个 参与 者 i 来 说 ， 
ws ) ,上 且 对 某 个 参与 者 /来 说 满足 Cs) 二 (的 策略 * 不 存在 , 则 策略 组 合 * 
是 有 效 的 。 

需要 强调 的 是 ,策略 组 合 * 比 策 略 组 合 ; 更 有 效率 ,并 不 代表 策略 组 合 s 是 有 效 的 。 
下 面 举例 说 明 : 办 徒 困境 中 wi (沉默 ,沉默 ) 三 ui (坦白 ,坦白 ) 对 i 二 1,2 都 成 立 , 且 对 i 二 
1,2,xi (沉默 , 沉 默 ) 之 在 (坦白 ,坦白 )( 对 两 个 人 中 任何 一 个 人 来 说 ,选择 策略 组 合 (沉默 ， 
沉默 ) 的 收益 大 于 等 于 选择 (坦白 ,坦白 ) 的 收益 ; 且 对 其 中 至 少 一 人 ,选择 前 者 的 收益 大 
于 选择 后 者 ), 即 可 说 明 ( 沉 默 , 沉 默 ) 比 (坦白 ,坦白 ) 更 有 效率 。 

请 注意 ,这 并 不 是 说 只 有 (沉默 ,沉默 ) 才 是 有 效 的 。 对 于 策略 组 合 ( 沉 默 , 坦 白 ) 和 ( 坦 
白 ,沉默 ) ,不 存在 能 使 两 个 人 收益 都 变 得 更 好 的 策略 组 合 , 所 以 (沉默 ,坦白 ) 和 (坦白 , 沉 


上 述 分 析 是 基于 最 基本 、 最 简单 的 囚徒 困境 模型 进行 的 。 但 在 看 到 某 些 现实 案例 时 ， 
你 也 许 会 想 ,会 不 会 有 人 因为 担心 对 方 的 报复 而 避免 选择 “坦白”? 的 确 , 进 行 决策 的 人 脑 
中 也 会 有 这 样 的 想法 。 


@ 一 般 情况 下 ,集体 利益 最 大 化 并 不 是 博弈 参与 者 的 根本 目标 ,人 们 在 决定 策略 时 依照 的 仍 是 “个 人 理性 ”。 此 
时 要 想 让 大 家 有 动机 达成 集体 利益 最 大 化 .可 以 制定 ^ 有 约束 力 的 协议 ”. 令 每 个 参与 者 选择 能 使 集体 利益 最 大 化 的 策 
略 时 可 以 得 到 合适 的 补偿 。 这 样 即 可 克服 个 体 利益 与 集体 利益 之 间 的 矛盾 。 存 在 “有 约束 力 的 协议 "的 博弈 被 称 作 
“合作 博弈 ”, 与 之 相对 的 是 * 非 合作 博弈 "。 合 作 博 弈 将 在 本 书 第 8 章 中 专门 介绍 。 
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(策略 。 博弈 论 导 论 ) 一 书 的 作者 乔 尔 。 沃 木 这 样 说 道 :“ 通 过 使 用 博弈 论 为 策略 互 
动 状况 建立 楼 型 是 一 种 艺术 ,最 好 的 模型 婚 能 捕 提 到 策略 环境 的 核心 特征 ,又 不 必 过 分 构 
泥 于 显示 而 导致 难以 分 析 。” 他 认为 ,作为 博弈 论 学 者 ,我 们 必须 坚持 将 所 有 这 些 因素 体现 
在 博弈 的 得 益 之 中 。 

如 果 因 徒 1 由 于 害怕 博弈 结束 后 受到 对 方 的 报复 而 更 倾向 于 选择 “沉默 ”, 为 了 刻画 
这 一 博弈 的 "实际 ”和 矩阵 ,我 们 应 让 无 论 对 手 做 出 何 种 选择 时 , 因 徒 1 选择 “坦白 ”的 收益 小 
于 选择 "沉默 ”所 得 。 在 这 种 情况 下 ,实际 的 博弈 并 不 是 一 个 “囚徒 困境 ”。 当 我 们 考虑 报 
复 行 为 时 ,应 该 正式 将 其 纳入 到 博弈 模型 里 。 同 理 , 如 果 双 方 达成 了 协议 ,协议 也 应 该 被 
纳入 到 模型 中 来。 

与 占 优 的 概念 不 同 ,要 特别 注意 : 效率 这 个 概念 并 不 是 针对 某 一 参与 者 的 某 一 策略 
而 言 的 ,我 们 不 能 说 * 某 个 策略 是 有 效 的 "。 正 确 的 说 法 是 :“ 某 个 策略 组 合 是 有 效 的 。” 

现在 ,在 研究 参与 者 行为 的 优 劣 时 ,我 人 有 了 两 套 标准 : 一 套 是 “个 人 占 优 标准 "意义 
上 的 占 优 ,基于 个 体 理性 ; 另 一 套 是 “ 帕 累 托 效率 "意义 上 的 占 优 ,基于 集体 理性 。 用 不 同 
的 标准 审视 问题 经 常会 带 来 不 同 的 结果 ,但 是 没有 熟 是 敦 非 。 两 种 思考 方式 都 是 正确 的 ， 
我 们 应 该 有 机 地 将 其 结合 起 来 ,多 角度 的 思维 方式 在 解决 现实 生活 中 的 问题 时 会 有 不 错 
的 效果 。 简 而 言 之 ,个 体 理性 与 集体 理性 虽 有 矛盾 和 冲突 ,但 也 可 以 达成 妥协 与 协作 。 本 
节 只 做 浅 析 , 详 见 第 7 章 。 

2. 帕 累 托 上 策 均衡 

并 非 所 有 存在 多 个 纳什 均衡 的 博 讲 都 会 让 人 难以 抉择 。 当 某 个 纳什 均衡 带 给 每 个 参 
与 者 的 收益 都 严格 大 于 其 他 纳什 均衡 时 ,如 果 参与 者 们 都 拥有 集体 理性 ,或 者 达成 了 合作 
的 合约 ,参与 者 们 的 选择 倾向 就 会 是 一 至 的 ,不 会 出 现 选择 困难 。 

这 种 依据 帕 累 托 效率 意义 上 的 优 劣 关系 对 多 重 纳什 均衡 进行 选择 ,进而 挑选 出 的 纳 
什 均衡 ,也 称 * 帕 累 托 上 策 均衡 ”。 

让 我 们 来 看 一 个 例子 ,如 图 2-51 所 示 。 人 类 历史 充斥 着 战争 , 国家 之 间 经 常 面临 战 
争 与 和 平 的 选择 。 从 国家 和 人 民 总 体 的 长 远 利益 来 看 ;战争 对 任何 一 方 都 是 有 害 无 益 的 。 
选择 战争 比 选择 和 平 好 的 情况 只 有 一 种 一 对 方 已 经 选择 了 战争 ,此 时 不 反击 就 会 任 人 
守 制 。 


国家 2 
战争 和 平 
-5 ,二 8 , -10 

国 战争 寺 .3 
和 平 | -10,8 10.10 


图 2-51 战争 与 和 平 得 益 矩 阵 


我 们 用 图 2-51 中 的 得 益 矩 阵 将 这 种 场景 转化 为 博弈 模型 。 参 与 者 是 国家 1 和 国家 
2, 策 略 集 包括 “战争 ”与 和平”。 得 益 的 数值 充分 反映 了 战争 给 双方 带 来 的 伤害 ; 而 且 当 
一 方 发 动 战争 , 另 一 方 选择 不 抵抗 时 ,后 者 的 处 境 更 加 悲惨 。 

以 博弈 的 视角 看 这 个 模型 : 博弈 中 存在 两 个 纯 策 略 纳什 均衡 (战争 ,战争 ) 与 (和平 ， 
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和 平 ) 。 显 然 ( 和 平 ,和 平 ) 在 帕 累 托 效 率 意义 上 更 好 ,所 以 策略 组 合 ( 和 平 , 和 平 ) 是 这 个 博 
弈 的 “ 帕 累 托 上 策 均衡 *。 换 言 之 ,如 果 两 个 国家 的 决策 者 都 是 理性 的 ,两 国 间 就 不 应 该 发 
生 战 争 。 对 双方 而 言 ,博弈 的 最 佳 选择 取决 于 对 方 的 选择 。 既 然 (和 平 , 和 平 ) 对 两 国都 有 
好 处 ,双方 都 希望 选择 和 平 并 期 望 对 方 也 选择 和 平 , 因 此 (和 平 , 和 平 ) 是 这 个 博弈 的 合理 
结果 。 

既然 每 个 国家 都 希望 选择 和 平 ,为 什么 历史 上 还 会 有 如 此 多 的 战争 ”这 个 问题 的 答 
案 有 很 多 ,或 许 决策 者 更 多 地 考虑 短期 利益 、 个 人 利益 、 集 团 利益 ,或 者 局 部 地 区 特定 时 期 
“战争 ”的 得 益 比 “和 平 * 的 得 益 大 …… 此 外 , 某 些 国 家 或 许 在 战争 时 还 击 比 不 还 击 的 损失 
更 大 ,先发制人 更 有 优势 ,等 等 ,也 会 导致 发 生 战争 的 概率 增 大 。 

寡头 垄断 市 场 的 价格 竞争 与 两 国 间 关 于 战争 与 和 平 的 选择 是 相似 的 。 企 业 间 的 价格 
竞争 有 时 就 是 一 场 战争 ,因此 上 述 战 争 与 和 平 的 选择 模型 也 可 用 以 分 析 寡头 市 场 的 价格 
竞争 问题 。 其 他 很 多 例子 也 可 利用 帕 累 托 上 策 均 衡 进行 分 析 , 读 者 不 妨 自己 在 生活 中 尝 
试 一 下 。 


2.4.2 策略 的 风险 与 风险 上 策 均 衡 


帕 累 托 上 策 均 衡 虽然 是 一 种 能 让 所 有 参与 者 都 受益 的 均衡 状态 ,但 与 我 们 在 内 徒 困 
境 中 看 到 的 一 样 ,参与 者 们 不 一 定 会 选择 这 种 均衡 一 一 他 们 清楚 ,所 有 人 仍然 是 具有 个 体 
理性 为 自己 考虑 的 ,所 以 可 能 背叛 。 这 就 导致 选择 帕 累 托 上 策 均 衡 可 能 意味 着 选择 
风险 。 
我 们 举 一 个 抽象 博弈 的 例子 来 解释 这 个 问题 ,博弈 如 图 2-52 所 示 。 
参与 者 B 


图 2-52 ”抽象 博弈 得 益 和 矩阵 


假设 在 我 们 的 博弈 中 参与 者 为 A 和 B, 参 与 者 A 可 以 选择 "U”(up) 和 ”*D”(down) 两 
种 策略 ,参与 者 B 可 以 选择 “L”(left) 和 *R”(right) 两 种 策略 ,各 种 策略 组 合 的 收益 如 
图 2-50 所 示 。 

根据 所 有 参与 者 的 收益 之 和 排序 来 确定 帕 累 托 上 策 为 (U,L), 因 为 9 十 9 二 18 大 于 
(U,R) 的 0 十 8 二 8、(D,L) 的 8 十 0 二 8、(D,R) 的 7 十 7 二 14。 而 且 在 这 种 策略 组 合 下 每 个 
参与 者 的 个 人 收益 都 严格 大 于 其 他 任何 一 种 策略 组 合 下 的 个 人 收益 。 

由 上 述 事实 我 们 理应 可 以 推断 双方 都 有 十 足 的 动机 达成 策略 组 合 (U,L) ,但 实际 上 ， 
双方 真 的 会 采用 帕 累 托 上 策 均 衡 (U,L) 吗 ? 

虽然 双方 采用 帕 累 托 上 策 均 衡 时 ,每 个 人 的 得 益 都 会 比 采取 另 一 纳什 均衡 CD,R) 多 
2 个 单位 。 可 是 一 旦 对 方 偏 离 了 (U,L) ,自己 的 得 益 就 是 0, 远 少 于 另 一 纳什 均衡 CD,R) 
的 7 个 单位 (无 论 对 方 采 用 何 种 策略 都 不 少 于 7 个 单位 ) 。 这 意味 着 (U,L) 对 于 两 个 参与 
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者 来 说 都 有 较 大 的 风险 。 从 混合 策略 的 角度 考虑 ,只 要 一 方 偏离 (U,L) 的 可 能 性 大 于 
1/8,(D,R) 就 是 比 (U,L) 更 加 明智 的 选择 ,此 时 博弈 双方 的 期 望 得 益 更 大 。 

因此 ,如 果 考 虑 风险 ,(D,R) 就 更 有 优势 : 虽然 在 帕 累 托 效率 意义 上 不 如 (U,L), 但 
在 风险 较 小 的 意义 上 却 优 于 (U,L)。 当 人 们 和 希望 更 稳妥 保险 一 些 时 ,就 会 选择 CD,R) 而 
非 (U,L)。 我 们 称 (D,R) 是 这 个 博弈 的 一 个 “风险 上 策 均衡 ”。 


WW 进 阶 阅读 : 1/8 这 个 数字 是 如 何 得 到 的 
首先 我 们 假设 参与 者 A 有 1 一 p 的 概率 偏离 (U,L), 即 参与 者 A 有 的 概率 选择 策 
略 U, (1 一) 的 概率 选择 策略 D, 结 果 如 图 2-53 所 示 。 


参与 者 B 
L R 


Up) | 9.9 | 0,8 | 
D(1-p) 8,0 Dd 


参与 者 A 


图 2-53 抽象 博弈 得 益 和 矩阵 


这 时 ,B 选 择 坚持 工 策 略 的 期 望 得 益 为 9p; 放弃 策 略 工 而 选择 策略 R 的 期 望 得 益 为 
8p 十 7(1 一 p) 二 p 十 7。 另 两 种 策略 的 期 望 得 益 相 等 , 即 

9p=p+7 

可 解 得 : p 二 7/8。 

当 参 与 者 A 偏离 (U,L) 的 概率 (1 一 户 ) 大 于 1/8, 即 户 小 于 7/8 时 , 户 十 7 过 9, 此 时 参 
与 者 B 选择 策略 R 的 期 望 收益 优 于 策略 L, 因 此 参与 者 也 会 倾向 于 选择 R 策略 ,偏离 
(UU,L) 均 衡 。 同 时 ,如 果 参 与 者 A 是 理性 的 ,知道 这 种 情况 下 BB 也 会 偏离 均衡 ,那么 A 一 
定 会 选择 D 策略 。 因 此 最 终 的 博弈 均衡 为 (D,R) 。 

同 理 , 对 参与 者 A 来 说 ,如 果 也 偏离 (U,L) 的 概率 大 于 1/8,A 也 会 改变 策略 ,偏离 
(UU,L) 均 衡 。 相 应 地 ,B 也 会 做 出 调整 ,双方 最 终 的 策略 组 合 也 是 (D,R)。 

综 上 ,双方 只 要 一 方 偏离 (U,L) 的 可 能 性 大 于 1/8,(D,R) 就 是 比 (U,L) 更 加 稳定 的 

猎 鹿 博弈 也 是 一 个 体现 了 风险 上 策 均 衡 思想 的 生动 案例 ,其 博弈 如 图 2-54 所 示 。 


猎人 2 
猎 座 猫 锡 
猎 鹿 5,5 0,4 
猎人 1 
猎 免 4.0 4.4 


图 2-54 猫 鹿 博弈 得 益 矩 阵 


循 着 和 前 一 个 例子 同样 的 思路 ,我 们 很 容易 知道 ( 猫 鹿 , 猫 鹿 ) 是 一 个 有 风险 的 策略 ， 
( 猫 兔 , 猎 兔 ) 是 一 个 风险 上 策 均 衡 。 只 要 双方 偏离 ( 猫 鹿 , 猫 鹿 ) 的 概率 大 于 1/5, 在 帕 累 
托 效率 意义 上 ,( 猎 兔 , 猎 免 ) 将 带 来 更 高 的 收益 。 由 此 我 们 推测 ,精明 的 博弈 参与 者 往往 
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选择 去 猎 免 而 不 是 老 老实 实地 参与 猎 鹿 。 

更 进一步 说 ,博弈 参与 者 对 于 风险 上 策 的 选择 倾向 ,有 一 种 自我 强化 的 机 制 。 当 部 分 
甚至 所 有 参与 者 选择 风险 上 策 均衡 的 可 能 性 增加 的 时 候 , 任 一 参与 者 选择 帕 累 托 上 策 均 
衡 的 可 能 性 会 进一步 变 小 ,于 是 参与 者 们 会 更 加 倾向 于 选择 风险 上 策 均 衡 ,这 又 使 得 帕 累 
托 上 策 均衡 的 得 益 更 小 。 这 就 形成 了 一 种 促进 参与 者 们 选择 风险 上 策 均衡 的 正 反馈 机 
制 ,使 其 出 现 的 可 能 性 越 来 越 大 。 

事实 上 ,这 种 反馈 机 制 的 存在 ,使 得 "达成 风险 上 策 均衡 "的 概率 增加 了 很 多 。 参 与 者 
对 其 他 参与 者 可 能 采取 风险 上 策 均衡 的 担心 ,最 终 变 成 了 大 家 达成 没有 效率 的 均衡 的 
现实 。 

这 种 反馈 机 制 还 会 随 着 相互 信任 难度 的 增加 而 强化 。 假 设 猎 鹿 博弈 中 不 再 是 两 个 人 
合作 就 能 拿 下 一 头 鹿 , 而 是 10 个 人 : 10 个 人 中 哪怕 1 人 不 合作 就 会 失败 。 认 为 其 他 9 个 
人 都 会 合作 显然 比 相信 1 个 人 会 和 自己 合作 更 加 困难 ,所 以 在 这 种 情况 下 ,人 们 就 很 难 自 
觉 地 选择 合作 。 换 言 之 ,合作 的 风险 太 大 以 至 于 理性 的 人 敬而远之 。 

总 的 来 说 ,风险 上 策 均衡 是 分 析 人 们 决策 行为 的 重要 规律 之 一 ,倘若 我 们 忽略 这 种 均 
衡 或 行为 规律 的 存在 ,忽略 风险 上 策 均衡 比 理论 值 的 更 高 的 可 能 性 ,就 可 能 无 法 对 很 多 决 
策 问题 做 出 正确 的 分 析 和 判断 ,无 法 对 很 多 现象 做 出 合理 的 解释 。 


分 思考 与 练习 
试 比较 图 2-55 和 图 2-56 两 个 博弈 ,恋恋 得 益 对 参与 者 策略 选择 的 影响 。 


参与 者 2 
A B 


A 99,99 0 ,100 
参与 者 1 


图 2-55 抽象 博弈 1 得 益 和 矩阵 


参与 者 2 
A B 


A 99.99 
参与 者 1 
B 100,0 


图 2-56 抽象 博弈 2 得 益 和 矩阵 


2.4.3 策略 的 多 重 性 与 聚 点 均衡 


在 博弈 中 我 们 还 可 能 遇 到 的 情况 是 ,存在 多 个 纳什 均衡 , 且 在 效率 意义 上 它们 不 相 上 
下 。 比 如 此 前 的 案例 “夫妻 之 争 ” 中 ,( 去 丈夫 家 ,去 丈夫 家 ) 和 (去 妻子 家 ,去 妻子 家 ) 两 种 
策略 组 合 都 是 很 好 的 。 在 现实 生活 中 , 遇 到 这 类 问题 的 时 候 我 们 似乎 又 总 能 找到 和 平 的 
解决 办 法 ,避免 冲突 。 
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1. 电话 博弈 

博弈 中 的 很 多 模型 稍 加 变形 就 可 以 应 用 在 日 常生 活 中 , 举 个 “夫妻 之 争 ” 的 例子 ,如 
图 2-57 所 示 , 丈 夫 和 妻子 正在 打 电 话 . 但 是 电话 突然 中 断 了 。 电 话 里 的 事 只 说 了 一 半 , 两 
人 都 急切 地 希望 赶快 重新 接 通电 话 。 此 时 应 该 由 丈夫 给 妻子 打 电话 ,还 是 由 妻子 给 丈夫 
打 电 话 呢 ? 


妻子 
打 电 话 等 电话 
打 电话 7 


图 2-57 电话 博弈 得 益 和 矩阵 


考虑 打 电 话 的 话费 (虽然 这 不 重要 ,但 我 们 不 妨 看 看 将 其 纳入 模型 会 带 来 什么 ) ,此 时 
的 纯 策 略 纳什 均衡 具有 ( 打 电 话 , 等 电话 ) 和 (等 电话 , 打 电 话 )。 这 和 夫妻 之 争 非常 相似 。 

假如 遇 到 这 个 场景 ,我 们 通常 的 做 法 是 什么 ? 答案 因 人 而 异 , 可 能 受到 习惯 (男士 应 
该 承担 更 多 责任 ) .环境 (妻子 的 手机 套餐 打 电 话 便宜 ) ,心理 (应 该 由 在 说 话 的 一 方 打 电 
话 ) 等 多 种 “博弈 之 外 的 规则 ”的 影响 。 这 些 规则 其 实 正 是 人 们 为 了 解决 和 避免 类 似 问题 
而 积 扒 下 来 的 经 验 。 

诺 贝尔 奖 获得 者 托马斯 " 谢 林 于 1960 年 在 他 的 (冲突 的 策略 ) 一 书 中 提出 了 “上 聚 点 ” 
的 概念 ,用 以 描述 博弈 论 中 人 们 在 没有 沟通 的 情况 下 的 选择 倾向 。 

2. 报时 博弈 

我 们 可 以 做 这 样 一 个 实验 : 随机 找 两 个 人 ,让 两 个 人 同时 报 一 个 时 间 ,假如 所 报 的 时 
间 相 同 , 则 各 获得 100 元 的 奖励 ,所 报 的 时 间 不 同 则 不 能 获得 任何 奖励 。 此 时 双方 对 所 报 
时 间 的 选择 就 是 一 个 博弈 。 显 然 , 这 个 博弈 存在 无 穷 多 个 纳什 均衡 ,双方 选择 的 任何 相同 
的 时 间 点 都 是 该 博弈 的 纳什 均衡 , 且 这 些 策略 之 间 完 全 不 存在 任何 效率 意义 上 的 优 劣 关 
系 。 但 我 们 不 难 想象 ,两 个 参与 者 选择 “中 午 12 点 ”0 点 ?这样 的 时 间 点 的 可 能 性 较 大 。 
而 类 似 * 早 上 8 点 02 分 “下 午 4 点 47 分 "这样 的 时 间 点 出 现 的 可 能 性 就 会 很 小 ,更 不 太 
可 能 成 为 双方 共同 的 选择 。 因 此 ,在 预料 到 这 些 之 后 ,参与 者 们 必然 会 选择 类 似 “ 中 午 12 
点 ”0 点 ”这样 的 时 间 点 。 虽 然 不 能 保证 双方 选择 一 致 , 但 至 少 可 以 大 大 提高 双方 选择 一 
致 的 概率 。 

我 们 称 * 中 午 12 点 ”0 点 ”这样 的 策略 为 上 述 博弈 中 的 “ 聚 点 ”。 在 多 重 纳什 均衡 的 
博弈 中 ,双方 同时 选择 一 个 聚 点 构成 的 纳什 均衡 称 为 “ 聚 点 均衡 ”。 

3. 城市 博弈 

聚 点 均衡 的 另 一 个 经 典 例子 是 “城市 博弈 ”。 我 们 可 以 来 看 一 个 简化 的 版 本 : 要 求 两 
个 博弈 参与 者 各 将 “上 海 .南京 .长春 、 哈 尔 滨 ”这 4 个 城市 分 成 两 组 ,每 组 各 两 个 城市 。 若 
两 人 分 法 相同 , 则 各 得 100 元 奖金 ,分 法 不 同 则 没有 任何 奖励 。 显 然 这 个 博弈 也 存在 多 个 
纳什 均衡 。 
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如 果 让 有 地 理 知 识 的 两 个 中 国人 来 参加 这 个 博弈 ,通常 两 人 会 将 上 海 和 南京 分 为 一 
组 ,长 春 和 哈尔滨 分 为 一 组 。 理 由 是 ,前 两 者 是 南方 城市 ,后 两 者 是 北方 城市 。 这 种 分 法 
是 有 基本 地 理 常识 的 人 最 容易 想到 的 ,因此 它 是 一 个 “ 聚 点 ”。 而 如 果 有 人 因为 自己 父母 
分 别 来 自 哈 尔 滨 和 上 海 而 将 它们 分 为 一 组 , 铠 怕 就 没什么 机 会 拿 到 奖金 了 。 

从 我 们 讨论 的 几 个 例子 可 以 看 出 , 聚 点 均衡 确实 反映 了 人 们 在 对 多 重 纳什 均衡 进行 
选择 时 具有 一 定 的 规律 性 。 可 是 这 种 规律 涉及 的 方面 太 多 ,虽然 对 每 个 具体 的 博弈 问题 
可 能 找 出 聚 点 ,但 对 于 一 般 的 博弈 却 难以 总 结 出 普遍 的 规律 ,只 能 具体 问题 具体 分 析 。 


分 思考 与 练习 
假设 一 个 美国 司机 和 一 个 日 本 司机 在 路 中 央 开 着 车 ,每 个 人 都 遵从 自己 国家 驾车 的 


习惯 。 以 上 均 为 共有 知识 。 哪 个 人 会 靠边 行驶 ? 这 会 演变 成 一 个 斗鸡 博弈 吗 ? 纳什 均衡 
能 做 出 准确 预测 吗 ? 


2.4.4 机制 设计 和 相关 均衡 


在 介绍 聚 点 均衡 的 时 候 我 们 看 到 了 博弈 之 外 的 规则 可 以 给 参与 者 带 来 好 处 。 那 么 我 
们 是 否 可 以 主动 地 创造 能 够 使 更 多 人 获 利 的 机 制 呢 ? 
相关 均衡 研究 的 就 是 通过 设计 或 者 利用 机 制 ,来 辅助 达成 均衡 的 方法 。 我 们 通过 
图 2-58 的 抽象 博弈 来 介绍 相关 均衡 的 基本 概念 。 
参与 者 乙 


U 
参与 者 甲 


图 2-58 抽象 博弈 

通过 简单 的 分 析 , 我 们 可 以 找 出 两 个 纯 策略 纳什 均衡 CU,L) 和 (D,R)。 通 过 计算 可 
以 找到 一 个 混合 策略 纳什 均衡 | (二 , 广 ), (去: 记 )]。 

我 们 来 观察 (U,L } 和 (D,R } 这 两 个 纯 策 略 纳什 均衡 。 尽 管 是 纳什 均衡 ,但 由 于 两 个 
策略 组 合 在 效率 意义 上 不 分 上 下 ,双方 很 礁 做 出 选择 。 而 且 没 有 “博弈 外 的 规则 ”, 就 不 会 
形成 " 聚 点 "。 因 此 双方 很 可 能 采取 混合 策略 。 

而 当 两 个 参与 者 希望 一 同 达成 混合 策略 纳什 均衡 时 ,很 可 能 遇 上 (U,R) 这 种 效率 非 
常 低 的 情况 。 计 算 可 得 , 若 两 个 参与 者 采取 混合 策略 纳什 均衡 ,双方 的 期 望 得 益 均 只 有 
2 ds 

试想 假如 两 个 人 能 找到 一 种 方法 避免 (U,R) 的 出 现 ,那么 势必 会 提高 两 个 人 的 平均 
得 益 。 比 如 甲 想 了 一 个 办 法 : 通过 挪 硬币 来 决定 采取 何 种 策略 一 如 果 硬币 正面 朝 上 ， 
则 甲 选 择 *U”, 乙 选择 *L”; 若 反面 朝 上 , 则 甲 选 择 *D”, 乙 选择 “R”。 既 然 (U,1) 和 (D,R) 
都 是 纳什 均衡 , 则 双方 无 论 看 到 正面 或 是 反面 ,都 没有 动机 偏离 均衡 , 亦 即 这 种 机 制 是 一 
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个 有 效 的 协调 机 制 。 这 样 双方 各 有 50% 的 可 能 性 获得 5 单位 的 收益 ,也 有 50% 的 可 能 性 
获得 1 单位 的 收益 ,平均 得 益 为 3 之 2.5。 可 见 利用 这 种 机 制 , 双 方 的 平均 得 益 高 于 采取 
混合 策略 纳什 均衡 的 平均 得 益 。 

我 们 将 这 种 引入 了 “相关 装置 "(如 例 中 的 硬币 ) 而 得 到 的 均衡 称 为 “相关 均衡 ”。 

其 实 这 个 博弈 还 可 以 得 到 更 好 的 结果 ,该 博弈 存在 一 个 风险 上 策 均衡 (D,L)。 例 如 ， 
当 甲 选择 U 时 ,其 得 益 可 能 是 5 或 0, 而 选择 D 时 则 为 4 或 1, 从 风险 规避 来 讲 ,D 优 于 
U。 对 于 乙 同 样 有 工 优 于 R。 所 以 (D,L) 是 风险 上 策 均衡 。 但 请 注意 , 它 不 是 纳什 均衡 ， 
仍 有 可 能 出 现 偏离 。 假 如 双方 都 这 么 想 ,那么 甲 认为 乙 将 选择 工 , 而 自己 选择 U 将 使 自 
己 的 得 益 从 4 增加 到 5。 于 乙 同 理 可 得 。 至 此 ,又 回 到 了 (U,L) 和 (D,R) 两 个 纳什 均衡 
上 。 所 以 风险 上 策 均衡 是 不 稳定 的 ,靠不住 的 。 

假如 设计 的 机 制 能 够 让 其 有 概率 出 现 , 且 避 开 效 率 很 低 的 (U,R) ,那么 期 望 得 益 显 
然 会 更 高 。 这 里 提供 一 个 可 以 实现 这 一 目标 的 示例 方案 。 

用 一 个 相关 装置 来 发 出 “相关 信号 ”: 

(1) 该 装置 以 等 可 能 性 (各 1/3) 发 出 A、B、C 三 种 信号。 

(2) 参与 者 1 只 能 看 到 该 信号 是 否 为 A ,参与 者 2 只 能 看 到 信号 是 否 为 C。 

(3) 两 个 参与 者 遵照 这 样 的 规则 行动 : 参与 者 1 看 到 A 采用 梧 , 否 则 采用 D; 参与 者 
2 看 到 C 采用 有 ,和 否则 采用 工 。 

不 难 发 现 这 种 机 制 会 带 来 这 样 的 效果 : U 和 R 不 可 能 同时 发 生 , 且 保证 了 (U,L)、 
(U,R)、(D,R) 以 相等 的 概率 (1/3) 出 现 。 这 样 提高 了 博弈 的 效率 ,并 且 具 有 稳定 性 一 
若 参 与 者 偏离 规则 可 能 会 导致 (U,R) 的 出 现 而 降低 期 望 得 益 , 这 是 不 明智 的 ,所 以 参与 
者 没有 动机 偏离 规则 。 此 时 的 期 望 得 益 为 (1 十 4 十 5)/3 二 10/3, 超 过 了 硬币 相关 机 制 中 的 
3, 显 然 更 好 。 


本 章 小 结 与 习题 
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Qs 
WE 

为 什么 “ 破 签 沉 舟 "可 以 提高 项 羽 获胜 的 可 信 度 ? 为 什么 有 些 国家 的 边缘 政策 一 再 奏 
效 ? 为 什么 人 们 在 有 些 情况 下 争先 恐 后 ,而 在 另 一 些 情况 下 却 一 拖 再 拖 ? 这 些 在 动态 博 
弈 的 学 习 中 都 能 找到 答案 。 谈 及 动态 博弈 难免 涉及 次 序 ; 而 有 先后 次 序 的 互动 ,常会 改 
变 原 本 静态 的 结局 。 先 行 的 行动 旨 在 获得 先 发 优势 ,以 期 先发制人 ,但 是 后 发 者 却 可 以 相 
机 选择 。 那 么 ,如 何 做 出 理性 的 先 发 行动 并 准确 预测 他 人 的 后 继 行 为 ? 动态 博弈 中 是 否 
也 存在 均衡 ? 应 如 何 定义 和 预测 这 些 均衡 ? 也 许 上 述 这 些 问 题 正 在 困扰 着 你 ,本 章 将 逐 
一 释 巧 。 

本 章 将 提取 一 些 关键 因素 来 定义 完全 且 完 美 信息 动态 博弈 ,并 介绍 一 个 新 的 均衡 概 
念 和 分 析 方法 。 此 外 ,本 章 还 会 展示 诸多 生活 中 的 例子 ,带领 你 领略 动态 博弈 之 美 下 。 


3.1 动态 博弈 的 表示 


人 引 语 故事 : 仿 目 博弈 


乐 泡 是 一 家 做 充电 宝 的 新 型 企业 。 然 而 从 2011 年 成 立 至 今 ,已 经 有 无 数 的 仿冒 者 充 
斥 在 市 场 上 。 仿冒 品 不 仅 使 买 到 假 货 的 消费 者 得 到 不 公平 的 待遇 ,更 对 厂商 的 品牌 造成 
难以 用 金钱 衡量 的 伤害 。 

造假 的 收益 不 可 谓 不 高 。 相 对 于 正品 售 价 139 元 ,一 个 成 本 只 有 20 多 元 的 假 移动 电 
源 ,在 网 上 可 以 卖 到 70~120 元 ,甚至 低 于 正品 出 厂价 格 , 利 润 惊 人 。 打 假 的 成 本 不 可 谓 
不 低 , 乐 泡 中 国电 商 运营 部 总 经 理 汤 行 解释 ,目前 国内 电 商检 举 的 程序 必须 靠 厂 商 自 己 购 
买 假 货 , 为 了 过 制 独 狐 的 造假 厂家 , 乐 泡 每 个 月 都 要 花 上 5 000 元 购买 大 约 100 件 的 造假 
产品 ,向 各 电 商 平台 提出 申诉 。 

乐 泡 CEO( 首 席 执行 官 ) 范 唆 苹 称 ; 自 2011 年 创立 品牌 后 就 饱 受 假 货 侵害 ,长 此 以 往 
将 严重 损害 整个 产业 的 创新 能 力 。 粗 略 计算 在 某 些 电 商 流通 的 假 货 , 乐 泡 每 年 会 损失 大 
约 1.5 亿 元 。 为 了 阻止 假 货 泛滥 , 乐 泡 专 门 成 立 了 打假 团队 ,聘请 维权 律师 以 及 专人 每 天 
到 各 网 站 上 收集 假 货 信息 ,监控 假 货 流通 .并 向 电 商 渠道 举报 。@ 


@ 在 未 做 说 明 时 ,动态 博弈 默认 为 完全 且 完美 信息 动态 博弈 。 对 于 不 完全 信息 、 不 完美 信息 的 动态 博弈 ,我 们 
将 在 后 面 章节 中 逐一 讨论 。 
@ ”资料 来 源 : 腾讯 科技 一 一 《一 个 创业 者 的 打假 记 : 淘宝 仿冒 最 多 年 损失 过 亿 》,2015 年 2 月 2 日 。 
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打假 者 为 何如 此 疲累 ? 造假 者 又 何以 不 顾 厂商 警告 ? 面 对 如 此 常见 而 又 破坏 性 极 大 
的 仿冒 者 ,我 们 不 妨 来 看 一 看 双方 是 如 何 博弈 的 , 即 仿冒 者 是 否 进入 市 场 与 正牌 厂商 就 如 
何 维权 所 展开 的 博弈 。 

假设 “ 酷 龙 "是 一 家 仿冒 厂商 ,决定 是 否 进入 市 场 仿制 “ 乐 泡 ” 的 产品 。 然 后 “ 乐 泡 ” 选 
择 是 否 采取 措施 制止 ,接着 “ 酷 龙 "选择 是 否 继续 仿冒 。 对 被 仿冒 的 企业 来 说 ,经 济 损失 在 
所 难免 ,采取 措施 制止 仿冒 可 以 维护 自己 的 利益 ,但 是 制止 仿冒 需要 付出 一 定 代 价 。 对 仿 
冒 企业 来 说 ,仿冒 不 被 制止 可 以 获得 更 大 利益 ,但 如 果 被 制止 就 可 能 得 不 偿 失 。 

这 是 一 个 动态 博弈 ,两 家 厂商 依照 不 同 次 序 行动 。 类 似 上 一 章 , 动 态 博 弈 中 的 策略 组 
合 也 用 大 括号 来 表示 。 例 如 ,( 仿 冒 / 仿 冒 ,不 制止 ) ,其 中 “仿冒 /仿冒 "表示 “ 酷 龙 ”" 第 一 次 
选择 仿冒 ,第 二 次 也 选择 仿冒 ;“ 不 制止 > 表示”* 乐 泡 ? 在 轮 到 它 第 一 次 行动 时 选择 不 制止 。 
因此 上 述 策略 组 合 的 完整 描述 为 : 第 一 阶段 酷 龙 ”进入 市 场 进 行 仿冒 ,第 二 阶段 * 乐 泡 ” 
不 制止 ,第 三 阶段 “ 酷 龙 ?继续 仿冒 。 假 设 不 仿冒 时 双方 得 益 为 (0,10) 一 一 实际 上 这 种 情 
况 对 应 了 4 种 策略 组 合 , 即 ( 不 仿冒 /仿冒 ,制止 ) (不 仿冒 /不 仿冒 ,制止 )。 此 外 假设 ( 仿 
冒 /仿冒 ,制止 ) (仿冒 /不 仿冒 ,制止 ) (仿冒 /仿冒 ,不 制止 ) (仿冒 /不 仿冒 ,不 制止 )4 种 
策略 组 合 分 别 对 应 收益 (一 2,2)、( 一 2,5)、(10,4) 和 (5,5)。 仿 照 静态 博弈 中 的 纳什 均衡 
分 析 方 法 ,可 以 对 该 案例 进行 图 3-1 所 示 的 分 析 。 


乐 泡 
制止 不 制止 


仿冒/ 仿冒 
仿冒 /不 仿冒 
不 仿冒 /仿冒 
不 仿冒 /不 仿冒 


图 3-1 仿冒 和 反 仿 冒 博弈 策略 形 


逐一 研究 这 8 种 策略 组 合 ,会 发 现存 在 3 组 纯 策略 形式 的 纳什 均衡 :仿冒 /仿冒 ,不 
制止 )、( 不 仿冒 /仿冒 ,制止 ) 和 (不 仿冒 /不 仿冒 ,制止 )。 在 后 两 种 均衡 中 ,“ 酷 龙 "都 不 会 
进入 市 场 进行 假冒 活动 ,因为 “ 乐 泡 ”一 定 会 采取 行动 制止 这 种 仿冒 行动 .而 且 “ 酷 龙 "在 第 
一 阶段 压根 不 打算 仿冒 。 

但 是 ,上 述 3 种 纳什 均衡 是 否 具有 稳定 性 呢 ? 能 否 正确 预测 博弈 结果 呢 ? 答案 是 并 
非 如 此 。 实 际 上 ,在 两 个 不 仿冒 的 纳什 均衡 中 ,存在 “ 酷 龙 ”仿冒 产品 的 可 能 性 。 因 为 “ 酷 
龙 " 不 进行 仿冒 活动 的 前 提 是 :“ 乐 泡 ” 做 出 了 一 系列 威胁 ,使 得 “ 酷 龙 "相信 当 它 们 进入 市 
场 从 事 仿冒 活动 之 后 ,“ 乐 泡 ” 一 定 会 采取 措施 进行 制止 。 假 设 “ 酷 龙 " 的 管理 者 是 一 个 见 
好 就 收 的 人 ,但 是 遇 到 特殊 情况 会 选择 鱼 死 网 破 。 如 果 乐 泡 进行 制止 ,那么 " 酷 龙 ”会 选择 
继续 进行 仿冒 活动 ; 如 果 “ 乐 泡 ”选择 不 制止 ,“ 酷 龙 ” 就 会 选择 退出 市 场 。 这 样 ,在 * 乐 泡 ” 
了 解 所 有 的 信息 ,并 且 “ 酷 龙 * 也 了 解 所 有 信息 的 情况 下 ,“ 酷 龙 ”一定 会 进入 市 场 进行 仿 
冒 。 因 为 “ 乐 泡 ” 不 会 采取 制止 行动 ,放任 的 策略 可 以 使 * 乐 泡 ” 减 少 损 失 。 
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上 述 案 例 表明 动态 博弈 分 析 和 静态 博弈 分 析 有 很 大 差别 ,我 们 不 能 将 静态 博弈 分 析 
的 方法 直接 套用 到 动态 博弈 分 析 中 去 ,因此 本 章 将 引入 新 的 概念 和 方法 来 分 析 动 态 博弈 。 


3.1.1 动态 博弈 的 扩展 式 表示 


动态 博弈 与 静态 博弈 最 大 的 不 同 在 于 : 各 参与 者 的 选择 和 行动 不 仅 有 先后 顺序 ,而 
且 后 行动 的 参与 者 可 以 在 行动 前 看 到 所 有 参与 者 此 前 的 行动 。 因 此 动态 博弈 无 法 用 上 节 
的 矩阵 形式 来 准确 表示 一 一 因为 矩阵 中 的 双方 都 看 不 到 对 方 的 行动 。 基 于 动态 博弈 中 的 
一 方 可 以 根据 对 方 的 行动 做 出 下 一 阶段 的 反应 ,我 们 将 介绍 一 种 用 来 描述 动态 博弈 的 模 
型 一 一 扩展 式 。 在 图 3-2 中 ,我 们 对 其 进行 了 清晰 的 描述 。 


(22) (2,5) (10.4) (5.5) 
图 3-2 仿冒 和 反 仿 冒 博弈 扩展 式 


注 : 在 动态 博弈 中 的 得 益 组 合 (Z,y) 中 ,表示 先行 动 者 的 得 益 , 而 y 则 表示 后 行动 
者 的 得 益 。 

在 图 3-2 中 ,节点 * 酷 龙 “ 乐 泡 " 表 示 “ 酷 龙 " 和 *“ 乐 泡 ” 的 选择 节点 , 意 即 相应 参与 者 在 
该 点 需要 做 出 选择 。 每 个 分 支 代表 可 供 参 与 者 选择 的 一 种 行动 方案 ,选择 一 个 分 支 就 等 
于 选择 了 一 种 行动 方案 。 一 个 参与 者 的 一 次 选择 行动 被 称 为 一 个 "阶段 *。 对 应 终点 的 数 
字 代 表 在 该 策略 下 博弈 双方 的 得 益 。 图 3-2 的 表示 方法 称 为 扩展 式 。 建 立 扩展 型 是 由 上 
而 下 的 (也 可 以 是 由 左 向 右 的 ) ,但 分 析 过 程 却 不 尽 然 , 下 文 将 介绍 逆向 推理 方法 。 在 该 扩 
展 型 中 ,“ 酷 龙 ” 首 先 做 出 仿冒 或 者 不 仿冒 的 决策 ,随后 “ 乐 泡 ”决定 是 否 制止 ,最 后 “ 酷 龙 ” 
决定 是 否 继续 仿冒 。 

对 于 复杂 的 动态 博弈 而 言 ,扩展 式 显然 比 策 略 式 描述 得 更 为 清晰 。 这 将 给 动态 博弈 
的 分 析 带 来 极 大 便利 。 不 仅 如 此 ,对 于 更 加 复杂 的 博弈 过 程 , 扩 展 式 也 可 以 进行 非常 直观 
的 描述 ,只 是 选择 节点 数 和 备 选 行动 数量 有 所 增加 、 参 与 者 的 利益 不 同 。 

请 注意 ,并 不 是 所 有 的 动态 博弈 都 可 以 用 扩展 式 来 表示 。 有 些 动态 博弈 ,如 下 象棋 ， 
不 但 博弈 阶段 非常 多 ,而 且 每 个 阶段 的 可 能 选择 也 很 多 ,无 法 用 扩展 式 表示 。 而 另 一 些 动 
态 博弈 中 ,参与 者 的 选择 有 无 穷 多 种 。 这 类 博弈 也 无 法 用 只 能 描述 有 限行 动 集合 的 扩展 
式 来 表示 。 无 法 用 扩展 式 表 示 的 动态 博弈 ,通常 可 以 用 数学 函数 加 以 表示 。 我 们 先 来 分 
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析 可 以 用 扩展 式 表示 的 博弈 ,随后 将 讨论 更 复杂 的 情况 。 
3.1.2 动态 博弈 的 特点 


正如 上 一 小 节 所 描述 的 ,与 静态 博 穿 不 同 ,博弈 的 “策略 "和 “结果 "在 动态 博 穿 中 拥有 
了 新 的 定义 。 

首先 , “策略 ”是 在 整个 博弈 中 所 有 选择 ,行动 的 计划 。 在 一 次 动态 博弈 中 ,每 个 参与 
者 的 决策 都 需要 根据 整体 ( 意 指 所 有 阶段 ) 的 利益 最 大 化 而 做 出 , 单 次 博弈 的 利益 得 失 并 
不 能 代表 最 终 博弈 的 胜利 。 因 此 ,在 整个 博弈 过 程 中 参与 者 常常 需要 放弃 局 部 利益 ,为 达 
到 最 终 胜利 而 做 出 相应 的 妥协 。 因 此 ,在 分 析 动 态 博 弈 的 策略 时 ,就 不 能 像 分 析 静 态 博 穿 
一 样 只 考虑 本 次 行动 的 纳什 均衡 ,任何 脱离 整体 的 最 优 策略 都 是 没有 意义 的 。 

当 要 考虑 的 不 仅 是 当下 对 全 而 是 整体 利益 的 时 候 , 身 在 博弈 之 中 需要 考量 得 更 加 长 
远 , 这 种 深 谋 远 虑 就 形成 了 动态 博弈 中 的 所 谓 "策略 ”, 每 一 步 棋 都 取决 于 对 手 的 反应 而 又 
旨 在 获得 优势 。 战 争 中 ,战事 激烈 是 以牙还牙 "的 策略 ,和 平 休战 是 " 友 光 养 上 " 的 策略 ， 
进攻 防守 都 只 为 战争 最 终 胜利 ; 恋爱 中 , 相 敬 如 宾 是 “以 德 报 德 ”的 策略 ,持续 冷战 是 “以 
直 报 怨 ? 的 策略 , 忽 冷 忽 热 也 只 为 爱情 修成 正果 。 

因此 ,在 上 一 章 中 无 区 别 的 两 个 词语 一 一 策略 和 行动 ,在 本 章 中 将 加 以 区 别 。 一 般 来 
讲 , 行 动 是 指 某 一 阶段 中 参与 者 的 一 次 选择 ,与 策略 不 同 。 

其 次 , “结果” 是 上 述 “ 计 划 型 "策略 的 组 合 ,构成 一 条 路 径 。 在 一 次 博弈 活动 中 存在 着 
很 多 条 路 径 , 参 与 者 的 每 一 次 选择 都 会 面临 很 多 分 支 。 沿 着 其 中 一 条 分 支 一 直 走 下 去 ,最 
终 会 得 到 一 条 完整 的 路 径 。 一 般 来 说 ,博弈 的 阶段 越 多 ,每 个 阶段 参与 者 的 选择 越 多 ,最 
终 的 路 径 也 会 越 多 。 结 果 还 包括 对 应 每 条 路 径 的 得 益 。 多 数 情况 下 ,我 们 无 法 计算 每 一 
阶段 之 后 各 参与 者 的 得 益 ,而 只 需 关 注 每 条 路 径 所 对 应 的 最 终 得 益 。 

最 后 ,相对 于 静态 博弈 来 说 ,动态 博弈 最 显著 的 特点 在 于 它 的 非 对 称 性 ,以 及 由 此 产 
生 的 先行 优势 或 后 动 优势 。 

动态 博弈 的 非 对 称 性 一 一 先后 次 序 " 决 定 动态 博弈 必然 是 非 对 称 的 。 例 如 ,在 仿冒 
与 反 仿冒 博弈 中 ,“ 酷 龙 "先行 动 , 即 选择 进入 市 场 仿冒 或 者 不 仿冒 。“ 乐 泡 " 会 根据 * 酷 龙 ” 
是 否 仿 冒 决定 是 否 制止 。 之 后 ,“ 酷 龙 ”又 会 根据 * 乐 泡 ” 的 决策 选择 是 否 继续 仿冒 。 由 于 
动态 博弈 的 参与 者 不 是 同时 做 出 决策 的 ,后 做 出 决策 的 参与 者 可 以 根据 先行 者 的 策略 调 
整 自己 的 决策 。 我 知道 你 的 行动 而 你 不 知道 我 的 .这 种 信息 的 不 对 称 性 会 导致 参与 者 处 
在 不 同 的 优 劣 势 中 。 

一 般 来 说 , 当 信息 不 完全 时 后 行动 的 参与 者 拥有 更 多 的 信息 来 帮助 自己 选择 ,从 而 避 
免 决 策 的 盲目 性 ,因此 处 于 有 利 地 位 , 即 “后 动 优势 "。 但 是 ,后 行动 和 具有 更 多 的 信息 并 
不 一 定 更 为 有 利 。 在 某 些 情况 下 , 先 选择 .行动 的 参与 者 更 有 利 , 有 “先行 优势 ", 如 下 棋 或 
足球 比赛 。 关 于 先行 优势 与 后 动 优势 ,我们 在 此 仅 做 简单 说 明 , 接 下 来 将 会 进行 更 加 深入 
的 讨论 。 
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3.2 ”相机 选择 与 策略 可 信 性 


3.2.1 老 方 法 遇 到 新 问题 


在 第 2 章 的 静态 博弈 分 析 中 ,我 们 引入 了 非常 重要 的 纳什 均衡 。 纳 什 均衡 描述 的 是 
一 种 状态 ,在 这 种 状态 下 ,任何 单独 的 参与 者 都 不 能 通过 改变 自己 的 策略 达到 增加 得 益 的 
目的 。 因 此 ,在 这 种 状态 下 参与 者 的 策略 具有 稳定 性 。 但 在 第 一 节 的 仿冒 与 反 仿冒 博弈 
问题 中 ,我 们 用 静态 博弈 分 析 方 法 所 得 到 的 (不 仿冒 /仿冒 ,制止 ) 和 (不 仿冒 /不 仿冒 , 制 
止 ) 两 个 纳什 均衡 并 不 具有 稳定 性 。 这 说 明 ,静态 博弈 的 纳什 均衡 分 析 并 不 能 直接 套用 到 
动态 博弈 中 。 

为 了 更 加 详细 地 说 明 纳什 均衡 分 析 在 动态 博弈 中 所 存在 的 问题 ,再 举 一 个 比较 形象 
的 例子 。 


< 案例 分 析 : 师 生 博 灾 


通常 情况 下 ,老师 都 采用 考试 的 形式 检验 学 生 的 学 习 效 果 , 督 促 学 生 认真 学 习 。 出 于 
公平 信念 和 个 人 声誉 的 考虑 ,老师 一 般 会 根据 学 生 答 题 情况 给 出 公平 的 分 数 。 但 是 ,考试 
成 绩 关系 到 学 生 的 切身 利益 ,包括 能 不 能 顺利 毕业 ,以 及 能 否 找 到 好 工作 。 现 假设 有 一 名 
学 生平 时 没有 认真 学 习 , 期 末 考 试 考 得 不 好 , 达 不 到 60 分 。 他 去 面 见 老师 ,希望 老师 能 够 
让 他 及 格 。 因 此 ,我 们 构造 以 下 的 师 生 博弈 : 老师 先行 动 ,决定 给 学 生 及 格 或 不 及 格 ; 学 
生 后 行动 ,根据 老师 的 判定 来 决定 自己 是 欣然 接受 这 一 成 绩 还 是 要 报复 老师 (所 谓 欣 然 
接受 是 指认 可 老师 给 出 的 分 数 ; 所 谓 报复 老师 是 指 对 老师 采取 一 些 人 身 或 名 誉 伤害 的 
行动 )。 

具体 来 说 ,学 生 会 有 4 个 策略 可 供 选 择 。 

策略 1: 如 果 老 师 给 及 格 , 则 欣然 接受 ; 如 果 给 不 及 格 , 则 报复 老师 。 

策略 2: 如 果 老 师 给 及 格 , 则 报复 老师 ,如果 给 不 及 格 , 则 欣然 接受 。 

策略 3: 不 管 老师 是 否 给 及 格 , 都 欣然 接受 。 

策略 4: 不 管 老师 是 否 给 及 格 , 都 报复 老师 。 

双方 的 得 益 情况 是 : 如 果 老 师 违 心 给 了 学 生 及 格 , 学 生 没有 报复 他 ,他 的 得 益 为 一 1， 
学 生 的 得 益 为 1; 如 果 他 违心 给 了 学 生 及 格 , 但 学 生还 是 报复 了 他 , 则 他 的 得 益 为 一 10, 此 
时 学 生 也 因为 报复 老师 被 学 校 处 分 ,得 益 为 一 10; 如 果 老 师 秉公 给 了 学 生 不 及 格 ,学 生 报 
复 , 则 老师 为 一 10, 学 生 也 为 一 10; 如 果 老 师 秉公 给 了 学 生 不 及 格 ,学 生 接 受 , 则 老师 的 得 
益 为 1, 学 生 为 一 1。 

我 们 分 别 用 图 3-3 所 示 的 扩展 式 和 图 3-4 所 示 的 策略 式 表示 这 一 博弈 。 

不 难看 出 ,上 述 博弈 有 三 个 纳什 均衡 。 分 别 为 “及 格 ,接受 /报复 ”不 及 格 , 报 复 / 接 
受 ”" 和 “不 及 格 ,接受 /接受 ”。 

在 第 一 个 纳什 均衡 中 ,学 生 声 称 : 如 果 老 师 给 及 格 就 接受 ,如 果 老 师 给 不 及 格 就 报 
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(1-D) (10.-10) (~1,D) (10.-10) 
图 3-3 师 生 博弈 扩展 型 
学 生 
(接受 ， 报 复 ) (报复 ， 接 受 ) (接受 ， 接 受 ) (报复 ， 报 复 ) 


及 格 
老师 
不 及 格 


图 3-4 师 生 博 弈 策略 型 


复 。 老 师 担心 自己 被 报复 ,违心 地 给 了 及 格 。 这 种 情况 下 ,老师 和 学 生 的 得 益 分 别 为 一 1 
和 1。 但 是 ,学 生 如 果真 的 报复 老师 ,会 遭受 到 更 为 严厉 的 处 罚 , 得 益 会 降 至 一 10。 因 此 ， 
理性 的 学 生 不 会 选择 报复 ,这 个 威胁 不 可 人 和信。 进一步 , 当 老 师 了 解 这 一 情况 时 , 便 不 会 相 
信和 学 生 的 威胁 ,也 就 不 会 违背 事实 地 给 出 及 格 。 因 此 ,这 一 纳什 均衡 不 具有 稳定 性 。 

在 第 二 个 纳什 均衡 中 ,学 生 声 称 : 如 果 老 师 给 及 格 就 报复 ,如 果 老 师 给 不 及 格 则 接 
受 。 博 弈 的 结果 是 : 老师 给 不 及 格 , 学 生 接 受 ; 双方 的 得 益 分 别 为 (1, 一 1)。 该 均衡 中 ， 
学 生 的 策略 (报复 ,接受 ) 要 求 在 老师 给 及 格 的 情况 下 选择 报复 ,但 报复 反而 会 使 其 得 益 降 
为 一 10。 显 然 ,这 是 一 个 不 可 置信 的 威胁 。 相 应 地 ,这 一 纳什 均衡 不 具有 稳定 性 , 即 学 生 
不 会 选择 (报复 ,接受 ) 的 策略 。 

在 第 三 个 纳什 均衡 中 ,学 生态 度 端正 ,不 管 老师 给 不 给 及 格 ,自己 都 能 接受 。 博 弈 的 
结果 是 : 老师 给 不 及 格 ,学生 接 受 ; 双方 的 得 益 分 别 为 (1, 一 1)。 这 个 纳什 均衡 比较 合 
理 , 没 有 包含 不 可 置信 的 威胁 ,应 该 符合 实际 情况 。 事 实 上 ,现实 生活 中 老师 通常 都 会 公 
正 地 评分 。 因 此 ,获得 好 成 绩 还 是 差 成 绩 . 关 键 还 在 于 学 生平 时 努力 的 程度 。 

Pd 扩展 阅读 : 司马 相 如 凤 求 凰 

司马 相 如 和 癌 文 君 ,一 个 是 被 临 于 县 令 奉 为 上 宾 的 才子 ,一 个 是 奸 居 在 家 的 佳人 。 他 
们 的 故事 ,是 从 司马 相 如 作客 草 家 ,在 草 家 大 堂上 弹唱 那 首 著名 的 《 凤 求 凰 》 开 始 的 :“ 凤 
分 凤 今 归 故 乡 , 遂 游 四 海 求 其 风 。 时 未 遇 今 无 所 将 , 何 悟 今 分 升 斯 堂 ! 有 艳 淑女 在 闺房 ， 
室 途 人 退 毒 我 肠 。 何 缘 交 颈 为 各 壮 , 胡 额 颜 分 共 翔 翔 ! …… ”这 种 在 今天 看 来 也 显得 直 
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率 \ 大胆、 热烈 的 措 荐 ,使 得 在 帘 后 倾听 的 卓文 君 必然 心动 。 在 与 司马 相 如 会 面 之 后 ,卓文 
君 更 是 一 见 倾心 。 

司马 相 如 遂 托 王 吉 向 卓 府 求 亲 ,但 遭 到 其 父 草 王孙 拒绝 。 卓 王孙 要 把 女儿 嫁 给 临 于 
富商 程 郑 之 子 , 但 文 君 坚决 不 从 。 在 一 个 漆黑 之 夜 ,卓文 君 和 司马 相 如 选择 了 私奔 ,更 在 
第 二 天 双双 驰 归 成 都 司马 相 如 老家 。 卓 王孙 闻 之 大 起 ,认为 司马 相 如 有 怕 衣 冠 , 自 己 的 女 
儿 也 太 不 争气 ,过夜 私奔 ,败坏 门 风 , 令 他 丢 尽 颜面 。 进 而 威胁 说 ,如 果 他 们 要 在 一 起 , 便 
与 车 文 君 断绝 父 女 关系 “ 女 至 不 材 ,我 不 忍 杀 , 不 分 一 钱 也 ”。 但 相信 爱情 的 卓文 君 仍然 
坚持 与 司马 相 如 在 一 起 。 他 们 过 着 “有 今天 , 没 明 天 ?的 通关 生活 ,根本 不 把 今后 的 生计 放 
在 心 上 。 几 个 月 后 ,他 们 索性 卖 掉 车 马 , 回 到 临 东 开 了 一 间 小 酒家 。 卓 文 君 淡妆 素 抹 , 当 
妒 沽 酒 。 司 马 相 如 更 是 穿 上 犊 盘 鼻 裤 ,与 保 佣 杂 作 , 涤 器 于 市 中 , 忙 里 忙 外 担任 跑 堂 工作 。 
上 车 王孙 经 不 起 亲朋 好 友 的 路 通 劝解 ,迫不得已 分 给 他 们 童 什 百人 , 钱 百 万 绢 , 并 厚 备 妆 杰 ， 
接纳 了 司马 相 如 。 


通过 上 面 的 扩展 阅读 ,可 以 看 到 在 动态 博弈 中 不 仅 存在 各 自 利 益 最 大 化 的 问题 ,更 重 
要 的 是 参与 者 会 根据 不 同 阶段 的 情况 灵活 做 出 决策 , 即 相机 选择 。 这 也 是 纳什 均衡 分 析 
失效 的 原因 。 更 进一步 地 ,在 相机 选择 中 ,威胁 和 承诺 的 可 信 性 尤为 重要 。 例 如 ,在 卓文 
君 和 卓 王 孙 的 博弈 中 , 卓 王孙 的 “断绝 父 女 关系 ”的 威胁 便 不 具有 可 信 性 ,毕竟 血 浓 于 水 。 
一 旦 * 生 米 者 成 熟 饭 ”, 对 于 父亲 而 言 接受 还 有 亲情 在 ,不 接受 连 亲情 也 没有 了 。 而 卓文 君 
也 没有 屈服 于 父亲 的 威胁 ,坚定 地 选择 了 自己 的 幸福 。 


3.2.2 相机 选择 


如 前 所 言 , 相 机 选择 和 可 信人 性 是 导致 纳什 均衡 在 动态 博弈 分 析 中 失效 的 主要 原因 。 
本 小 节 将 通过 “ 开 金 矿 博弈 "及 其 变异 版 本 来 进一步 分 析 相 机 选择 和 策略 的 可 信 性 问题 。 

开 金 矿 博 弈 : 假设 甲 发 现 了 一 个 价值 4 万 元 的 金 矿 ,但 是 甲 没有 资金 开采 人 金 矿 。 甲 
的 朋友 乙 刚 好 有 1 万 元 的 资金 准备 投资 。 设 甲 想 说 服 乙 将 钱 借 给 自己 用 于 开矿 ,并 承诺 
将 采 到 的 金子 与 乙 平分 。 那 么 , 乙 是 否 该 将 钱 借 给 甲 呢 ? (假设 甲 用 1 万 元 一 定 可 以 开采 
出 价值 4 万 元 的 金 矿 , 则 乙 所 需要 关心 的 则 是 甲 在 采 到 金子 后 会 履行 诺言 ,还 是 会 带 着 这 
4 万 元 跑 路 。) 

我 们 考虑 三 种 不 同 的 博弈 情况 ,逐次 进行 分 析 。 在 图 3-5 中 ,博弈 双方 只 存在 两 阶段 
的 博弈 ,相对 比较 简单 。 乙 方 最 初 的 资金 为 1 万 元 , 若 不 做 任何 投资 则 这 些 资金 既 不 会 升 
值 也 不 会 贬值 。 如 果 将 资金 借 给 甲 , 甲 在 开 金 矿 的 过 程 中 成 功 完成 资产 的 增值 , 即 甲 得 到 
资金 数量 为 4 万 元 。 如 果 甲 选择 与 乙 平分 , 则 每 人 得 到 2 万 元 。 但 如 果 甲 选择 独自 占有 
这 4 万 元 , 则 乙 血 本 无 归 。 

在 该 博弈 中 , 乙 决策 的 关键 是 要 判断 甲 的 承诺 是 否 可 信 。 根 据 参 与 者 的 理性 假设 ,可 
以 判断 轮 到 甲 行 动 时 一 定 会 选择 “不 分 ”, 即 独自 占有 4 万 元 。 乙 如 果 足 够 理性 ,应 该 清楚 
甲 的 行动 准则 ,因此 他 第 一 阶段 会 选择 “不 借以 保住 自己 的 本 金 。 对 乙 来 说 ,本 博 穿 中 甲 
的 承诺 是 不 可 信和 的 。 

在 现实 的 投资 活动 中 这 种 情况 确实 存在 。 如 果 甲 方 与 乙方 是 单 次 合作 , 甲 有 理由 和 
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动机 剥 前 乙 的 利益 (当然 甲 会 采取 五 花 八 门 的 手段 使 这 种 剥 前 显得 合法 )。 但 是 如 果 甲 方 
与 乙方 追求 的 是 长 期 合作 ,每 一 步行 动 都 受到 对 手 的 牵制 ,每 一 步 的 决策 都 要 考虑 全 局 利 
益 。 此 时 甲 方 会 选择 在 单 次 博弈 中 的 妥协 来 追求 整体 的 胜利 。 

在 图 3-6 中 ,我 们 追加 了 这 样 的 假设 , 即 “ 在 有 法 律 保障 ”。 在 这 种 情况 下 ,法 律 是 值 
得 大 家 信任 的 维权 手段 ,法 律 的 执行 成 本 很 低 .在 诉 诸 法 律 之 后 ,受害 方 可 以 切实 地 维护 
自己 的 权益 。 

图 3-5 与 图 3-6 唯一 的 区 别 在 于 : 当 甲 选择 不 分 钱 的 时 候 ,乙方 可 以 选择 打 官 司 或 不 
打 官 司 。 当 乙 选 择 “ 不 打 ” 官 司 时 , 甲 独 春 4 万 元 , 乙 仍 然 血 本 无 归 。 但 是 , 当 乙 选择 “ 打 ” 
官司 时 ,可 以 收回 自己 的 1 万 元 本 金 ,而 甲 方 则 会 因为 高 额 的 赔偿 和 罚款 而 一 无 所 有 。 乙 
“ 打 ” 官 司 的 得 益 比 “不 打 ” 官 司 的 得 益 大 ,因此 乙 一 定 会 选择 打 官 司 。 甲 清楚 乙 的 上 述 思 
路 ,知道 如 果 自 己 在 第 二 阶段 选择 “不 分 ”, 等 着 他 的 必然 是 一 场 官 司 和 失去 所 有 的 收入 。 
对 甲 来 说 , 乙 “ 打 ”官司 的 威胁 是 可 信和 的 。 因 此 甲 在 第 二 阶段 会 选择 “分 ”"。 这 时 , 甲 * 分 ”的 
承诺 也 具有 了 可 信和 性 ,因此 乙 在 第 一 阶段 会 选择 “ 借 ”。 博 弈 的 最 终结 果 是 乙 在 第 一 阶段 
选择 “ 借 ”, 甲 在 第 二 阶段 选择 “分 ”, 从 而 结束 博弈 ,双方 各 得 到 得 益 2, 实 现 了 合作 共 赢 。 

这 种 情况 下 的 博 穿 是 人 们 一 直 追 求 的 市 场 效率 最 高 的 博 穿 , 投 资 者 会 毫 不 犹 移 地 选 
择 投资 ,促进 整个 社会 的 发 展 。 但 是 ,在 图 3-6 中 * 法 律 能 够 保障 公民 的 合法 权益 ”的 条 件 
并 不 是 总 能 满足 的 。 在 现实 生活 中 ,法 律 诉讼 劳民伤财 ,因此 有 时 可 能 打 赢 官司 只 是 让 被 
告 受 一 些 损失 ,自己 在 经 济 上 并 不 一 定 合算 。 在 这 种 情况 下 ,图 3-7 所 描述 的 博弈 则 也 在 
现实 中 广泛 存在 。 


(22) (0.4) (1.0) (0.4) (-1.0) (0,4) 


图 3-5 开 金 矿 博弈 图 3-6 有 法 律 保 障 的 开 金 矿 博弈 ”图 3-7 法 律 保障 不 足 的 开 金 矿 博弈 


在 图 3-7 中 ,我们 假设 法 律 是 不 健全 ,不 完善 的 ,通过 法 律 手段 维护 权利 的 成 本 很 大 
(包括 时 间 成 本 和 机 会 成 本 )。 如 果 乙 在 甲 拒绝 分 享 收 益 时 上 诉 , 不 但 不 能 追 回 本 金 , 反 而 
还 要 承受 1 万 元 的 损失 。 

在 这 种 情况 下 , 乙 在 第 三 阶段 会 选择 “不 打 ” 官 司 , 以 防止 进一步 损失 。 对 甲 来 说 , 乙 
在 第 三 阶段 “ 打 ” 官 司 的 威胁 就 成 了 不 可 信 的 “空头 威胁 ”。 因 此 , 甲 在 第 二 阶段 会 选择 “不 
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分 ”。 乙 清楚 甲 的 思路 ,自然 甲 在 第 二 阶段 “分 " 钱 的 承诺 也 不 可 和信 了 。 因 此 乙 在 博弈 的 第 
一 阶段 会 选择 “不 借 ”。 

通过 对 * 开 金 矿 博弈 及 其 变异 版 本 的 分 析 , 相 信 你 已 经 体会 到 了 相机 选择 的 思想 。 
它 指出 动态 博弈 中 普遍 存在 的 现象 : 参与 者 会 根据 不 同形 势 不 同 时 机 做 出 对 自己 有 利 的 
选择 。 这 也 意味 着 ,无 论 威胁 多 么 可 怕 ,承诺 多 么 诱 人 ,只 要 到 了 相应 节点 参与 者 的 偏离 
有 利 可 图 ,他 都 没有 理由 依照 事前 的 要 求 行动 。 相 机 选择 是 动态 博弈 中 特有 的 现象 ,是 序 
列 理性 ?的 要 求 。 序 列 理性 要 求 指 动态 博弈 中 每 个 阶段 都 要 求 参与 者 是 理性 的 。 进 一 
步 , 相 机 选择 的 存在 也 要 求 参与 者 在 制定 策略 时 考虑 该 策略 是 否 能 够 针对 不 同情 况 做 出 
相应 的 反应 。 


2 扩展 阅读 : 相机 选择 


曹操 三 征 张 绣 时 ,听闻 束 绍 欲 攻 许 都 ,于 是 下 令 撤 军 。 张 绣 要 亲自 率 兵 追击 昔 军 。 员 
调 对 张 绣 说 :“ 不 能 追击 ,追击 一 定 会 失败 。? 张 绣 没 有 听从 ,进兵 与 曹军 交战 ,结果 被 打 得 
大 败 而 回 。 贯 调 又 对 张 绣 说 :“ 赶 快 再 去 追击 ,再 打 一 仗 必定 获胜 。” 张 绣 说 :“ 没 有 听从 
您 的 建议 , 才 落 到 这 步 田 地 。 现 在 已 经 打 了 败仗 ,怎么 又 要 追击 呢 ?” 贯 调 说 :“ 用 兵 的 形 
势 有 了 变化 ,赶快 去 追 一 定 有 利 。" 张 绣 相 信 了 他 的 话 , 于 是 聚集 逃 散 的 士兵 再 去 追击 ,与 
曹军 大 战 ,果然 获胜 返回 。 这 就 是 相机 选择 的 一 个 通俗 解释 。 


相机 选择 的 存在 ,使 得 参与 者 所 设 定 的 行动 计划 的 “可 信 性 "遭受 质疑 ,进而 博弈 的 路 
径 和 结果 也 存 有 不 确定 性 。 如 果 缺 乏 可 信 的 承诺 或 威胁 ,博弈 往往 难以 按照 参与 者 所 预 
想 的 方向 发 展 ,博弈 结果 也 难以 令 人 满意 。 

那么 什么 策略 满足 序列 理性 的 要 求 呢 ? 什么 策略 可 以 使 承诺 或 威胁 可 信 呢 ? 事实 上 ， 
这 样 的 策略 有 很 多 种 。 例 如 ,常见 的 以 牙 还 牙 , 以 德 报 怨 \ 以 直 报 怨 ` 以 她 报 怨 、 存 光 养 上 等 ， 
它们 都 能 够 既 简单 又 直接 地 做 出 反应 。 在 不 同情 况 下 ,可 以 综合 运用 这 些 策略 化 解 危机 。 


< 全 Wi 他 解读 以 下 还 看 向 


以 牙 还 牙 的 含义 是 : 别人 对 我 怎么 做 ,我 接着 也 对 他 这 么 做 。 补 充 一 句 ,这 个 策略 在 
开始 阶段 假设 双方 是 合作 的 ,以 后 则 模仿 对 手 在 前 一 阶段 的 行动 。 当 双方 的 可 能 行动 集 
合 不 相同 时 ,可 以 简单 地 理解 为 : 别人 善意 则 我 也 善意 ; 别人 恶意 则 我 也 恶意 ; 别人 返回 
善意 , 则 我 也 善意 ,不 记 仇 。 

以 牙 还 牙 法 则 体现 了 任何 一 个 行 之 有 效 的 策略 所 应 该 符合 的 4 个 原则 : 清晰 、 善 意 、 
刺激 性 和 宽容 性 .“ 以 牙 还 牙 " 简 单 易 懂 、 直 观 清 晰 ,让 对 手 很 容易 领悟 。 这 一 法 则 不 会 引 
发 作弊 ,因而 是 善意 的 。 它 更 不 会 让 作 环 者 授 逐 法 外 ,因此 能 够 产生 刺激 。 同 时 它 还 是 宽 
容 的 ,因为 它 促 使 参与 者 恢复 合作 ,而 不 是 长 时 间 怀 恨 在 心 。 这 一 法 则 非常 简单 实用 , 它 
的 威力 已 被 阿 克 谢 罗 德 设计 的 二 人 因 徒 困境 博弈 锦标 赛 @ 所 证 明 。 


@ 序列 理性 亦 称 序 贯 理性 。 
加 ”这 里 不 再 详细 解释 “二 人 囚徒 困境 博弈 锦标 赛 ". 有 兴趣 的 读者 可 参阅 (策略 思维 一 一 商界 、 政 界 及 日 常生 活 
中 的 策略 竞争 )。 
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不 过 ,以 牙 还 牙 策略 是 一 个 有 缺陷 的 策略 。 只 要 有 些许 发 生 误解 的 可 能 性 ,以 牙 还 牙 
策略 的 胜利 就 会 土 骨 瓦解 。 例 如 ,1987 年 ,美国 就 苏联 侦察 和 窃听 美国 驻 莫斯科 大 使 馆 
一 事 做 出 回应 ,宣布 减少 在 美国 工作 的 苏联 外 交 官 人 数 。 苏 联 的 回应 是 调 走 苏 联 在 美国 
驻 莫斯科 大 使 馆 的 后 勤 人 员 , 同 时 对 美国 外 交 使 团 的 规模 做 出 更 加 严格 的 限制 。 结 果 双 
方 都 难以 开展 各 自 的 外 交工 作 。 以 牙 还 牙 策 略 的 问题 在 于 ,任何 一 个 错误 都 会 反复 出 现 。 
一 方 对 另 一 方 的 背叛 行动 进行 惩罚 ,从 而 引发 连锁 反应 。 对 手 受 到 惩罚 之 后 ,不 甘 示 弱 ， 
进行 反击 。 如 此 反复 。 

因此 ,在 人 际 交 往 而 非 对 抗 性 竞赛 中 ,我 们 要 有 足够 的 宽容 ,而 不 是 简单 地 采取 以 牙 
还 牙 的 报复 行动 ,才能 避 开 恶性 循环 的 结果 。 


3.2.3 如 何 提高 策略 的 可 信 性 


言语 的 束缚 实在 软弱 无 力 ,根本 抑制 不 了 人 们 的 贪 禁 。 
一 一 托马斯 。 堆 布 斯 (Thomas Hobbs) 

有 时 我 们 想 让 别人 相信 ,他 们 应 该 或 不 该 采取 某 种 行动 ,否则 他 们 会 受到 惩罚 ; 有 时 
我 们 做 出 承诺 , 想 要 说 服 别 人 向 我 们 施 以 援手 。 如 果 承 诺 和 威胁 不 可 信 ,它们 就 不 会 改善 
我 们 的 博弈 结果 。 那 么 怎么 做 才 可 以 提高 承诺 和 威胁 的 可 信 性 呢 ? 这 里 我 们 提供 些许 建 
议 ,对 提高 可 信 性 有 一 定 帮 助 。 但 这 些 方法 的 适用 范围 有 限 ,具体 情景 还 需 灵活 应 对 。 

1. 建立 和 利用 声誉 9 

声誉 的 建立 源 于 重复 博弈 中 对 承诺 的 遵守 ,参与 者 有 理由 相信 一 个 从 来 不 会 违背 承 
诺 的 合作 者 会 继续 履行 承诺 。 因 为 声誉 的 建立 需要 很 多 次 的 遵守 承诺 ,而 声誉 的 摧毁 只 
需 一 次 违约 即 可 。 对 于 一 个 声誉 良好 的 参与 者 来 说 ,建立 声誉 所 付出 的 成 本 巨大 ,以 至 于 
违反 承诺 所 带 来 的 利益 不 足以 使 其 动心 。 换 言 之 ,声誉 良好 的 参与 者 没有 偏离 的 动机 。 

关于 建立 声誉 的 一 个 非常 成 功 的 案例 是 商 拷 * 徙 木 立信 ”。 公 元 前 356 年 , 商 质 拟定 
变法 法 令 后 , 欲 让 百姓 知 其 必 行 , 遂 在 秦 国 都 城 的 南 门 放 了 一 根 3 丈 长 的 木头 ,并 贴 出 告 
示 : 如 有 人 将 这 根木 头 搬 到 北 门 就 赏 10 金 。 搬 一 根木 头 不 是 什么 难事 , 却 能 得 到 如 此 多 
的 奖励 ,老百姓 觉得 太 奇怪 ,不 知 其 中 有 什么 名 堂 ,都 不 敢 去 动 木头 。 商 蒜 于 是 提高 奖励 
规格 ,宣布 凡 能 按 要 求 搬 动 木头 者 ,给 予 “五 十 金 ” 的 奖赏 。 重 赏 之 下 必 有 和 勇 夫 ,有 一 壮士 
把 木头 从 南 门 搬 到 了 北 门 , 商 蒜 如 约 赏 给 了 他 50 金 。 此 事 过 后 ,老百姓 更 加 相信 商讨 变 
法 后 的 美好 愿景 。 借 此 ,商讨 建立 了 政策 权威 并 取信 于 民 , 变 法 得 以 顺利 进行 。 

2. 签订 合同 

一 个 使 承诺 可 信 的 直接 有 效 方法 就 是 同意 在 自己 不 能 遵守 承诺 的 时 候 接受 惩罚 。 如 
果 在 事先 约定 违反 承诺 会 遭受 巨大 的 惩罚 ,那么 承诺 方 违 反 承诺 的 动机 就 会 碱 少 。 人 迫 于 
对 惩罚 的 点 惧 ,承诺 方便 会 遵守 承诺 ,履行 职责 。 而 签订 合同 就 是 将 双方 的 承诺 和 违约 的 
惩罚 置 于 法 律 的 监管 与 约 东 下 ,以 确保 承诺 和 短 罚 的 效力 。 笔 者 通过 对 产业 创新 联盟 内 
的 承诺 研究 也 发 现 , 偏 离 承 诺 的 行为 着 实 不 可 完全 避免 ,但 是 基于 最 大 可 能 损失 的 您 罚 原 


四 ”关于 声誉 的 具体 讨论 ,请 参见 第 5 章 . 第 6 章 。 
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则 却 能 在 很 大 程度 上 降低 这 种 情况 的 发 生 概率 。 

假如 负责 为 你 重新 装修 房子 的 工人 事先 能 得 到 一 大 笔 酬金 ,他 就 有 动机 减 慢 工程 进 
度 。 但 是 ,一 份 具体 说 明了 酬金 与 工程 进度 有 关 、 同 时 附 有 误工 惩罚 条 款 的 合同 却 能 让 他 
意识 到 : 严格 遵守 商定 的 时 间 表 才 最 符合 自己 的 利益 。 这 份 合 同 就 成 了 使 承诺 得 以 遵守 
的 手段 。 

签订 合同 在 现代 社会 中 非常 普遍 ,尤其 在 商业 交易 中 ,合同 是 维护 市 场 秩序 的 重要 基 
石 。 合 同 的 签订 确保 了 贸易 的 正常 进行 ,促进 了 资本 周转 ,已 经 成 为 社会 运转 的 一 个 不 可 
或 缺 的 重要 因素 。 实 际 上 ,假如 声誉 影响 足够 大 ,可 能 根本 没 必 要 签订 一 份 正 式 合同 ,也 
即 “ 一 言 既 出 , 驯 马 难 追 。 

3. 破釜沉舟 , 围 师 必 阅 

破釜沉舟 的 故事 想必 大 家 都 有 所 了 解 。 秦 朝 末 年 , 楚 霸 王 项 羽 率领 部 队 与 秦 军 作战 ， 
打算 救援 赵 国 。 项 羽 下 令 士兵 每 人 带 足 三 天 的 口粮 ,然后 又 下 令 砸 碎 全 部 行军 做 饭 的 锅 。 
将 士 们 都 表示 难以 理解 ,项 羽 说 :“ 没 有 锅 , 我 们 可 以 轻装 前 去 ,立即 挽救 危在旦夕 的 赵 
国 ! 至 于 吃饭 嘛 ,让 我 们 到 章 邯 军营 中 取 锅 做 饭 吧 !" 大 军 渡 过 了 漳 河 ,项 羽 又 命令 士兵 把 
渡船 全 都 磺 沉 ,同时 烧 掉 所 有 的 行军 帐篷 。 战 士 们 一 看 退路 没 了 ,这 场 仗 如 果 打 不 赢 ,将 
必死 无 疑 。 渡 河 的 楚 军 无 不 以 一 当 十 ,以 十 当 百 ,个 个 如 下 山 猛 虎 , 奋 勇 拼 杀 。 经 过 多 次 
交锋 , 楚 军 终于 以 少 胜 多 ,大 获 全 胜 。 

在 这 场 战 争 中 ,项 羽 用 实际 行动 向 自己 的 手下 传达 了 此 战 必 胜 的 决心 。 他 自 断 后 路 ， 
自 知 失败 必死 。 此 举 看 似 冲动 , 却 很 巧妙 地 将 大 家 团结 在 了 一 起 ,提升 了 军队 的 士气 。 项 
羽 用 这 种 ”* 儿 而 走 险 ”的 方式 给 对 手 施 加 了 一 个 可 信 的 威胁 ,打击 了 对 手 的 器 张 气焰 ,为 自 
己 的 胜利 商定 了 基础 。 当 然 , 这 种 方式 显得 有 些 极端 。 很 多 时 候 , 只 要 象征 性 地 切断 自己 
的 后 路 即 可 。 

除了 上 面 介绍 的 建立 和 利用 声誉 .签订 合同 和 破釜沉舟 三 种 方式 外 ,还 有 很 多 种 方法 
让 承诺 或 威胁 变 得 可 信和 或 不 可 信 。 例 如 ,切断 联系 、 同 归于 尽 、 哇 步 前 进 、 寻 求 代理 人 或 第 
三 方 等 ,有 兴趣 的 读者 可 参见 (妙趣 横生 博弈 论 ) 一 书 。 

概括 地 讲 , 这 些 方法 体现 了 三 个 原则 : 第 一 个 原则 是 改变 博弈 的 列 利 , 意 即 务必 使 遵 
守 你 的 承诺 成 为 符合 你 自身 利益 的 选择 : 把 威胁 变 成 警告 ,把 许诺 变 成 保证 。 第 二 个 原 
则 是 改变 博弈 的 行动 和 信息 ,使 人 背弃 承诺 的 能 力 大 受 限 制 。 第 三 个 原则 是 借助 他 人 。 
一 个 团队 也 许 会 比 单独 一 个 人 更 容易 建立 可 信和 度 ; 或 者 ,加 入 对 你 有 利 的 参与 者 从 而 改 
变 未 来 局 势 。 

第 一 个 原则 的 主导 思想 是 不 改变 既 有 博弈 的 结构 ,而 采取 行动 改变 参与 者 的 得 益 。 
例如 , 古 时 商 识 " 徙 木 立 信 ? 时 从 10 金 提 高 到 50 金 ,现代 人 力 资源 管理 中 所 常见 的 经 济 赏 
罚 等 。 

第 二 个 原则 是 改变 现 有 博弈 的 结构 ,主要 指 改变 博弈 的 选择 机 会 .行动 次 序 以 及 信息 
披露 等 。 例 如 ,警察 在 追捕 嫌犯 时 可 以 鸣 枪 示警 ,警告 嫌犯 自己 有 可 能 开 枪 ,向 嫌犯 披露 
了 自己 的 真实 信息 。 又 如 , 某 些 企业 为 了 顺利 实现 所 承诺 的 产量 ,常常 将 生产 活动 分 解 成 
多 步行 动 , 定 期 检查 ,分 期 交 货 ,等 等 ,这 就 是 “ 积 哇 步 以 至 千里 ”。 


98 博弈 论 入 门 


第 三 个 原则 是 改变 参与 者 的 数量 。 因 为 参与 者 数量 越 多 ,博弈 的 结果 就 越 复 杂 。 此 
时 参与 者 可 以 通过 引入 对 自己 有 利 的 第 三 方 或 团队 而 改变 博弈 的 局 势 。 

例如 《三国 演义 ) 中 刘备 过 江 招亲 这 一 情节 。 孙 权 承 诺 嫁 妹 本 是 假意 ,但 是 诸葛 亮 将 
计 就 计 , 为 了 能 够 成 功 联姻 ,授意 赵云 大 张 旗 鼓 地 去 拜访 乔 国 老 。 这 样 一 来 ,有 了 更 多 的 
参与 者 和 可 能 结果 ,从 而 加 大 了 成 功 的 可 能 性 。 

又 如 ,战国 时 期 著名 政治 战略 " 合 纵 " 策 略 。“ 合 纵 ” 就 是 许多 弱 国 联合 起 来 抵抗 一 个 
强国 ,以 示 “ 抵 抗 行动 "更 可 信 。 赵 、 魏 、 韩 等 国 曾 多 次 采用 合 纵 策略 对 抗 强 秦 ( 或 齐 国 ) 以 
求 自 保 或 扩张 领土 。 在 这 段 历史 时 期 中 ,所 谓 的 威胁 与 承诺 也 不 断 因 第 三 方 的 加 入 或 叛 
离 而 变 得 扑朔迷离 。 在 现代 社会 , 随 着 市 场 竞争 的 日 趋 激烈 ,大 品牌 ,大 企业 逐渐 形成 了 
行业 垄断 的 态势 ,给 大 量 的 小 微 企业 个体户 带 来 巨大 的 冲击 。 为 了 对 抗 强大 品牌 的 冲 
击 , 合 纵 连 模 的 商业 策略 开始 发 挥 作用 , 异 业 联 盟 ? 模 式 应 运 而 生 。 但 是 提请 读者 注意 ， 
在 实践 中 可 能 是 多 种 方法 的 综合 运用 。 遇 到 这 样 的 特殊 情况 , 需 综合 考虑 ,灵活 处 理 。 

除了 上 述 原则 外 ,在 博弈 中 掌握 主动 性 也 很 重要 。 积 极 的 博弈 者 常常 主动 出 击 ,顺势 
而 为 。 例 如 ,战国 时 期 的 苏秦 即 是 一 例 。 燕 国 大 夫 苏秦 因 担 心 自己 与 太后 私 通 的 事情 败 
露 而 遭 迫 害 ,主动 向 燕 王 请 辞去 齐 国 做 卧底 。 到 齐 国 后 , 精 于 游说 的 苏秦 深 得 齐 王 信 任 。 
齐 国 众 大 夫 嫉 妨 苏 秦 位 高 权重 , 派 人 刺杀 。 但 是 苏秦 重伤 未 死 。 齐 王 派 人 捉拿 多 手 ,并 未 
成 功 。 在 将 死 之 时 ,苏秦 请 求 齐 王 在 他 死 后 以 "苏秦 为 燕 作 乱 于 齐 ? 为 名 将 之 车 裂 于 市 ,并 
晤 赏 行刺 之 人 以 诱 使 贼人 出 现 。 齐 王 照 计 行事 :成功 诛 杀 凶手 ,苏秦 得 以 眠 目 。 苏 秦 在 齐 国 
虽 为 间谍 却 位 高 名 显 ,同时 他 又 屡 受 燕 臣 族 陷 而 化 险 为 夷 ,这 些 大 多 凭借 他 的 顺势 而 为 和 主 
动 出 击 。 当 然 , 只 有 这 些 是 远 远 不 够 的 ,其 卓越 的 战略 眼光 和 政治 才智 才 是 立身 之 本 。 


3.3 新 的 均衡 概念 


上 一 节 曾 指出 了 纳什 均衡 在 动态 博 穿 分 析 中 的 紫 端 , 即 纳什 均衡 不 是 真正 具有 稳定 
性 的 均衡 概念 。 为 此 ,需要 发 展 一 个 能 够 排除 不 可 信行 动 的 新 的 均衡 概念 ,以 满足 动态 博 
弈 分 析 的 需要 。 本 节 将 引入 “动态 博弈 的 均衡 "的 概念 以 及 动态 博弈 分 析 的 基本 方法 一 一 
“ 道 向 归纳 法 ”。 


3.3.1 逆向 归纳 法 


在 动态 博弈 中 ,理性 的 参与 者 都 希望 提高 自己 的 预见 力 , 看 得 越 远 越 好 (譬如 下 棋 ) 。 
一 种 非常 自然 的 想法 是 : 给 定 自身 的 行动 ,对 方 将 会 作 何 反应 ? 推 而 广 之 ,在 最 后 阶段 的 
博弈 中 ,假定 此 前 所 有 阶段 的 行动 均 已 知 , 则 参与 者 将 作 何 反 应 ? 一 种 广 为 采 用 的 方法 
是 : 从 最 后 阶段 参与 者 的 行动 开始 分 析 , 倒 推 回 前 一 个 阶段 相应 参与 者 的 行动 选择 , 逐 阶 
段 回 退 ,直至 第 一 个 阶段 。 此 即 逆向 归纳 法 ,已 经 被 广泛 接受 。 逆 向 归纳 法 是 动态 博弈 分 析 


@ 异 业 联 盟 是 一 种 新 型 的 商业 模式 。 通 过 组 织 机 构 、 网 站 ,将 大 量 的 小 微 企业 个体户 联合 起 来 ,实现 统一 思 
想 , 统 一 销售 政策 ,甚至 联合 促销 ,从 而 达到 对 抗 强 大 品牌 的 商业 目的 。 
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中 最 重要 、 最 基础 的 方法 。 下 面 将 通过 一 个 简单 的 例子 来 介绍 逆向 归纳 法 的 应 用 与 操作 。 
对 于 图 3-5 所 示 的 开 金 矿 博弈 . 先 分析 第 二 阶段 甲 选择 “分 "还 是 “不 分 ”。 由 于 甲 选 

择 不 分 时 的 得 益 为 4, 而 选择 分 时 的 得 益 只 有 2, 因此 他 必然 会 

选择 不 分 。 所 以 , 当 博 弈 进行 到 第 二 阶段 ,结果 必然 是 甲 选 择 不 

分 ,双方 的 得 益 为 (0,4)。 接 下 来 递 推 分 析 第 一 阶段 。 既 然 双 方 


都 是 足够 理性 的 ,那么 上 述 两 阶段 博弈 就 与 图 3-8 所 示 的 单 人 “ 寺 
博弈 完全 等 价 了 。 
分 析 这 个 单 人 博弈 非常 简单 。 显 然 , 乙 的 最 佳 选择 是 * 不 04) Un) 
借 ”。 这 个 结果 也 与 我 们 在 1. 2. 2 中 的 分 析 结 论 相 一 致 。 图 3-8 开 金 矿 博弈 的 
逆向 归纳 法 事实 上 就 是 把 多 阶段 动态 博弈 化 为 一 系列 的 单 等 价 博弈 


人 博弈 ,通过 对 一 系列 单 人 博弈 的 分 析 ,确定 各 参与 者 在 各 自选 

择 阶段 的 行动 ,最 终 对 动态 博弈 结果 (包括 博弈 的 路 径 和 各 参与 者 的 得 益 等 ) 做 出 判断 。 
归纳 各 个 参与 者 在 各 阶段 的 行动 则 可 得 到 各 个 参与 者 在 整个 动态 博弈 中 的 策略 ,而 所 有 
参与 者 策略 所 形成 的 策略 组 合 ,就 是 一 个 均衡 ! 


< 案例 分 析 : 种 族 歧视 与 运动 队 


在 美国 ,种 族 歧视 一 直 是 严重 的 社会 问题 。 在 1947 年 之 前 ,美国 职业 棒球 大 联盟 中 
从 来 没有 过 黑人 。 在 分 队 比 赛 时 ,具有 棒球 天 分 的 黑人 球员 会 被 安排 到 黑人 俱乐部 。 基 
于 此 ,我 们 来 探讨 一 下 关于 种 族 歧 视 的 博弈 。 

假设 有 两 支 球 队 A 和 B, 有 4 名 运动 员 {1,2,3,4)。 棒 球 运动 员 按 照 种 族 和 才能 划 
分 ,如 表 3-1 所 示 。 球 队 A 不 考虑 种 族 , 他 们 认为 较 有 才能 的 球员 具有 更 高 的 价值 ; 而 球 
队 也 既 看 重 种 族 也 看 重 才能 ,他 们 认为 这 两 个 最 好 的 白人 球员 具有 最 高 的 价值 。 每 个 球 
队 都 希望 征 慕 的 球员 能 够 使 球 队 的 整体 价值 最 大 化 。 球 员 征 幕 的 规则 为 : 球 队 A 先 从 4 
名 球员 中 任意 挑选 一 名 (假设 球 队 A 具有 优先 选择 权 ) ,接着 球 队 也 在 剩余 的 三 名 球员 中 
选择 一 名 ,然后 球 队 A 在 剩余 两 名 球员 中 选择 一 名 ,最 后 一 名 球员 归 球 队 B。 


表 3-1 棒球 运动 员 的 划分 博弈 


球员 才能 种 族 球 队 A 的 收益 球 队 也 的 收益 
1 30 黑 30 20 
2 25 白 娩 25 
3 22 白 22 2 
4 20 黑 20 10 


我 们 用 图 3-9 所 示 的 扩展 型 表示 该 棒球 队员 征 募 博弈 (得 益 数 组 中 ,上 面 的 数字 表示 
球 队 A 的 得 益 ,下 面 的 数字 表示 球 队 B 的 得 益 ) 。 

现在 我 们 用 逆向 归纳 法 分 析 这 个 博弈 。 考 虑 球 队 A 第 二 次 选择 的 12 个 决策 点 ,每 
个 决策 点 有 两 个 选择 。 比 较 两 个 选择 的 得 益 , 并 选择 其 中 较 大 的 一 个 ,我 们 可 以 将 图 3-9 
简化 为 图 3-10。 


100 博弈 论 入 门 


A 
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52 50 55 5055 5247 45 55 45 55 47 47 42 352 42 52 47 45 4250 4250 45 
35 47 32 47 32 3530 42 32 42 32 30 30 45 35 45 35 30 42 45 47 4547 42 
图 3-9 球员 征 募 博 弈 扩展 型 


A 


35 了 名 独 有 入 0. 对 
图 3-10 球员 征 募 博弈 的 等 价 博弈 一 


现在 我 们 来 考虑 第 二 阶段 球 队 B 的 决策 。 在 每 
个 决策 点 , 球 队 B 有 三 个 选择 ,显然 球 队 B 将 选择 
得 益 最 大 的 一 个 。 因 此 ,我 们 可 以 将 博弈 进一步 简 
化 为 图 3-11 所 示 的 博弈 。 

现在 我 们 考虑 第 一 阶段 球 队 A 的 决策 。 显 然 ， 
球 队 A 选 择 2 号 可 以 获得 最 大 得 益 。 相 应 地 , 球 队 5 
B 在 第 二 阶段 会 选择 3 号 或 4 号 , 球 队 A 在 第 三 阶 图 3-11 球员 征 募 博弈 的 等 价 博弈 二 


52 55 52 50 
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段 选择 1 号 。 最 终 ,两 支 球 队 的 得 益 分 别 为 55 和 32 。 

北向 归纳 法 不 但 逻辑 清晰 、 简 单 实用 ,更 为 重要 的 是 ,利用 该 方法 得 出 的 结论 是 非常 
可 靠 的 。 由 于 逆向 归纳 法 所 确定 的 各 阶段 行动 都 是 建立 在 后 续 阶 段 理 性 选择 基础 之 上 
的 ,因此 自然 排除 了 不 可 信 威 胁 或 承诺 发 生 的 可 能 性 。 因 而 ,由 它 所 确定 的 各 个 参与 者 的 
策略 组 合 是 稳定 的 均衡 。 


3.3.2 子 博弈 完美 纳什 均衡 


在 介绍 子 博弈 完美 纳什 均衡 前 ,需要 先 引 入 * 子 博弈 ”的 概念 。 

定义 3.1 由 一 个 动态 博弈 某 阶段 开始 的 后 续 博 弈 阶段 所 构成 的 、 有 初始 信息 集 和 
博弈 所 需 的 全 部 信息 、 能 够 自 成 一 个 博弈 的 原 博弈 的 一 部 分 , 称 为 原 动 态 博 弈 的 一 个 “ 子 

以 图 3-12 所 示 的 三 阶段 开 金 矿 博弈 为 例 。 如 果 乙 在 第 一 阶段 选择 了 “ 借 ”, 动 态 博 弈 
将 进行 到 第 二 阶段 , 即 甲 做 选择 。 这 时 甲 面 临 的 是 一 个 在 乙 已 经 借 钱 给 他 的 前 提 下 ,自己 
选择 是 否 分 成 ,然后 再 由 乙 选 择 是 否 打 官司 。 这 本 身 构成 了 一 个 两 阶段 的 动态 博弈 ,我 们 
称 之 为 原 博弈 的 一 个 “ 子 博弈 "。 当 甲 选择 不 分 , 轮 到 乙 选择 打 官 司 还 是 不 打 的 第 三 阶段 ， 
就 是 上 述 子 博弈 的 子 博弈 ,我们 称 后 面 的 子 博弈 为 原 博弈 的 二 级 子 博弈 *。 图 3-12 所 示 
的 外 、 内 两 层 虚线 框 分 别 表示 原 博弈 的 两 级 子 博弈 。 


图 3-12 有 法 律 保障 的 开 金 矿 博弈 的 两 级 子 博弈 


除了 上 述 可 以 用 扩展 式 表示 的 动态 博弈 有 子 博 弈 外 ,事实 上 ,无 法 用 扩展 式 表 示 的 无 
限 多 种 策略 动态 博弈 也 有 子 博弈 。 例 如 ,在 无 限 多 种 策略 的 讨价还价 博弈 中 , 当 一 参与 者 
在 第 一 阶段 提出 一 个 报价 以 后 ,第 二 阶段 开始 另 一 参与 者 选择 是 否 接受 报价 ,或 者 提出 什 
么 反 报 价 等 ,就 构成 原 博弈 的 一 个 子 博 弈 。 

在 子 博弈 概念 的 基础 上 ,我 们 引入 “ 子 博弈 完美 纳什 均衡 "概念 。 

定义 3.2 如 果 在 一 个 完美 信息 的 动态 博弈 中 ,由 各 参与 者 的 策略 所 构成 的 一 个 策 
略 组 合 满足 : 在 整个 动态 博弈 及 它 的 所 有 子 博弈 中 都 构成 纳什 均衡 ,那么 这 个 策略 组 合 
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称 为 该 动态 博弈 的 一 个 “ 子 博弈 完美 纳什 均衡 ”。 

子 博 弈 完美 纳什 均衡 与 纳什 均衡 的 根本 不 同 之 处 ,就 在 于 子 博 弈 完美 纳什 均衡 能 够 
排除 均衡 策略 中 不 可 信 的 威胁 或 承诺 ,因此 具有 稳定 性 。 非 子 博弈 完美 的 纳什 均衡 ,虽然 
可 以 构成 整个 博弈 的 纳什 均衡 ,但 其 中 包含 的 不 可 信行 动 选择 ,至少 在 博弈 的 某 些 子 博弈 
中 不 符合 参与 者 自身 的 利益 ,因而 不 构成 可 信 的 纳什 均衡 而 要 求 在 所 有 子 博弈 中 都 是 纳 
什 均衡 的 子 博弈 完美 纳什 均衡 ,排除 了 其 中 存在 不 可 信行 动 选择 的 可 能 性 ,因而 在 动态 博 
弈 分 析 中 具有 真正 的 稳定 性 。 

求解 子 博弈 完美 纳什 均衡 的 最 基本 方法 就 是 逆向 归纳 法 。 按 照 逆向 归纳 法 的 定义 ， 
从 动态 博弈 的 最 后 一 级 子 博弈 开始 ,逐步 寻找 参与 者 在 各 级 子 博弈 中 的 最 优选 择 ,最终 便 
可 得 到 动态 博弈 的 子 博弈 完美 纳什 均衡 。 


3.4 几 类 经 典 案例 
3.4.1 寡 占 的 斯 塔 克 博 格 模型 


二 引 语族 事 : 铁 矿 石 价格 


据 《 第 一 财经 日 报 )2012 年 6 月 29 日 报道 9, 伴 随 着 爹 球 经 济 形势 的 不 确定 性 因素 增 
加 ,巴西 淡水 河谷 公司 .澳大利亚 力 拓 公司 必和必拓 公司 这 全 球 三 大 铁 矿 石 巨 头 对 于 未 
来 铁 矿 石 的 景气 度 预期 也 逐渐 出 现 分 歧 , 最 终 导致 三 家 公司 做 出 了 不 同 的 战略 选择 。 三 
大 巨头 中 ,前 两 大 铁 矿 石 公司 淡水 河谷 和 力 拓 仍然 倾向 于 大 幅 扩 大 铁 矿石 产能 ,而 必 和 必 
拓 则 开始 变 得 谨 小 慎 微 起 来 。 

6 月 27 日 ,淡水 河谷 负责 铁 矿 石 及 策略 业务 的 执行 董事 在 一 次 电话 会 议 上 表示 ,到 
2017 年 该 公司 铁 矿石 年 产能 有 望 达到 4.6 亿 吨 。 外 媒 援引 执行 董事 的 观点 称 , 目 前 淡水 
河谷 在 巴西 北部 、 南 部 和 东南 部 矿区 的 铁 矿 石 年 产量 总 计 3. 1 亿 吨 。 到 2017 年 ,Serra 
Sul 项 目 将 使 公司 铁 矿 石 年 产能 增加 9 000 万 吨 ,Serra Norte 项 目 将 使 公司 年 产能 增加 
4000 万 吨 。 

力 拓 也 没有 晴 惧 可 能 到 来 的 铁 矿石 产能 过 剩 的 格局 。6 月 20 日 , 力 拓 曾 表示 ,尽管 
公司 正在 采取 前 减 和 调整 资本 支出 的 措施 ,但 仍 决定 向 澳大利亚 和 几内亚 的 铁 矿 石 业务 
进一步 投资 42 亿美 元 。 这 将 实现 该 公司 至 2015 年 将 铁 矿石 产量 提升 至 3. 53 亿 吨 的 目 
标 。 力 拓 铁 矿石 目前 年 产能 为 2.3 亿 吨 。 

相对 于 这 两 大 公司 的 激进 ,必和必拓 公司 CEO 马里 厄 斯 。 高 瑞 思 则 显得 很 保守 。 
5 月 底 ,他 到 访 中 国 并 接受 国内 媒体 采访 时 表示 ,过 去 几 年 ,因为 铁 矿 石 供 应 偏 紧 , 价 格 也 
很 高 。 但 现在 “钢铁 和 铁 矿 石 领 域 快 速 增长 的 时 期 可 能 已 经 过 去 ”。 正 是 基于 这 样 的 市 场 
预期 判断 ,5 月 ,必和必拓 主席 雅克 。 纳 瑟 宣 布 , 公 司 削 减 了 一 项 规模 达 800 亿美 元 的 投 


@ 资料 来 源 : http://www. yicai. com/news/1854839. html. 
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资 支 出 方案 。 

然而 三 年 之 后 状况 如 何 呢 ? 据 ( 华 尔 街 见闻 )2015 年 7 月 22 日 报道 9, 尽 管 投资 者 纷 
纷 逃 离 商品 ,但 矿业 巨头 们 似乎 并 没有 减产 的 打算 。 全 球 最 大 的 矿 企 必和必拓 正在 增加 
铁 矿石 产量 ,这 给 原本 就 过 剩 的 供应 增加 了 不 少 压 力 ,也 给 铁 矿 石 未 来 的 前 景 蒙 上 了 
阴影 。 

必和必拓 最 新 公布 的 产量 报告 显示 ,2016 财 年 的 产 出 将 增长 6 外 至 2.47 亿 吨 。 包 括 
必和必拓 、 淡 水 河谷 . 力 拓 在 内 的 生产 商 不 断 扩 大 产能 ,而 最 大 的 买 家 一 一 中 国 的 需求 依 
然 低迷 ,这 令 铁 矿石 价格 连续 走低 。 

基准 铁 矿石 价格 这 个 月 触及 至 少 是 2009 年 以 来 的 新 低 , 重 新 回 到 能 市 区 间 。7 月 8 
日 ,运送 到 青岛 港 的 62% 品 位 铁 矿 石 价格 跌 至 44. 59 美元 ,为 至 少 是 2009 年 5 月 以 来 的 
最 低 价 。 


由 引 语 故事 可 以 看 出 ,在 2012 年 力 拓 和 淡水 河谷 开始 扩充 产能 时 ,必和必拓 就 预计 
产能 将 出 现 过 剩 ,利润 下 滑 ,继续 增产 是 逆 势 而 行 。 然 而 ,其 后 的 发 展 却 出 乎 意料 。 随 后 
几 年 必和必拓 义 坚定 不 移 地 连年 增加 产能 ,至 少 截至 2015 年 7 月 是 这 么 做 的 。 必 和 必 拓 
在 反驳 别人 指责 时 曾 说 :“ 如 果 我 们 不 这 样 做 ,其 他 的 公司 也 会 这 样 做 .必和必拓 的 做 法 
符合 理性 吗 ? 为 什么 会 出 现 这 种 局 面 ? 现在 我 们 来 分 析 这 种 动态 的 寡头 市 场 产量 博弈 模 
型 一 一 寡 占 的 斯 塔 克 博 格 模型 。 该 模型 与 上 一 章 的 古 诺 模 型 十 分 相似 ,唯一 的 区 别 是 博 
弈 双方 的 选择 是 先后 有 序 而 不 是 同时 进行 的 。 

简单 起 见 ,假设 模型 中 有 两 个 寡头 : 厂商 1 和 厂商 2。 厂 商 1 先 选择 自己 所 生产 的 产 
量 , 厂 商 2 在 观察 到 厂商 1 的 选择 之 后 再 选择 自己 的 产量 。 两 个 厂商 的 产量 分 别 为 gl 和 
gz (gl 和 gz 为 不 小 于 0 的 实数 ) ,总 产量 为 QCQ=di 十 qz )。 设 两 个 厂商 的 边际 生产 成 本 
都 为 二 cz 二 2, 并 且 没 有 固定 成 本 。 价 格 与 产量 之 间 的 关系 为 P= 二 P(Q) 二 8 一 Q(Q 二 8)。 
厂商 1 的 得 益 为 ,厂商 2 的 得 益 为 xz 。 

由 于 两 个 参与 者 可 以 选择 的 产量 水 平 有 无 限 多 个 ,因此 这 一 动态 博弈 无 法 用 扩展 型 
表示 ,只 能 用 描述 得 益 函 数 的 方法 表示 。 根 据 上 述 假设 ,两 厂商 的 得 益 可 以 表示 为 

uu=qP(Q)—cag=q[L8—(q+gq)j—2g1=6g1—g1g2—g? 


xz 二 dg2P(Q) 一 czq2 一 qz[L8 一 (qi 十 qz)] 一 2q2 一 6qz 一 q1q2 一 0 

至 此 ,我 们 阐述 的 都 是 之 前 研究 古 诺 模型 时 已 经 接触 过 的 东西 。 现 在 ,我 们 用 逆向 归 
纳 法 来 分 析 这 个 博弈 , 找 出 它 的 子 博弈 完美 纳什 均衡 。 

根据 逆向 归纳 法 的 思路 ,我 们 先 分 析 第 二 阶段 厂商 2 的 决策 。 在 厂商 2 决策 时 ,厂商 
1 选择 的 qi 实际 上 已 经 决定 了 。 针 对 这 一 情况 ,问题 转化 为 : 在 给 定 gl 的 情况 下 求 使 uz 
实现 最 大 值 的 g; 。 这 样 的 oz 必须 满足 如 下 条 件 : 

6—2g2 —q =0 

即 


@ 资料 来 源 : http://wallstreetcn. com/node/221104. 
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邓 = 二 6 一 00 = 3 一 和 (3-1) 


厂商 1 知道 厂商 2 的 这 种 决策 思路 ,因此 在 选择 o 时 知道 厂商 2 的 产量 gz 会 根据 式 (3-1) 
确定 。 因 此 在 确定 自己 的 最 佳 产量 g? 时 ,可 以 将 式 (3-1) 直 接 代入 自己 的 得 益 函 数 。 即 


ul = 6g1 — gig? — gt = 6g1 a (3 号 gf = 3g1 3 (3-2) 


式 (3-2) 是 关于 qi 的 一 元 函数 ,也 就 是 说 , 当 把 厂商 2 的 反应 方式 考虑 进来 之 后 ,厂商 1 
的 得 益 就 完全 由 他 自己 控制 了 。 根 据 式 (3-2) ,厂商 1 可 以 直接 求解 出 gf , 令 ol = 时 ， 
式 (3-2) 对 qi 的 倒数 等 于 0, 可 得 


3 一 9 三 0 
qr 一 3 
即 厂商 1 的 最 佳 选 择 是 生产 3 单位 。 由 式 (3-1) 可 得 ,厂商 2 的 最 佳 产量 为 3 一 1. 5 二 1.5 
单位 。 此 时 市 场 价格 为 3. 5, 双 方 的 得 益 分 别 为 4.5 和 2.25 单位 。 
厂商 1 在 第 一 阶段 选择 3 单位 产量 ,厂商 2 在 第 二 阶段 选择 1. 5 单位 产量 ,就 是 这 个 
动态 博弈 中 唯一 的 子 博弈 完美 纳什 均衡 。 
回忆 一 下 我 们 在 上 一 章 讨 论 的 古 诺 模 型 ,其 纳什 均衡 是 g? 一 二 2。 比 较 两 个 结 
果 , 会 发 现 斯 塔 克 博 格 模型 均衡 的 总 产量 较 多 ,价格 较 低 ,总 利润 也 较 少 。 但 是 ,厂商 1 的 
斯 塔 克 博 格 博弈 均衡 产量 大 于 古 诺 模型 均衡 产量 ,而 厂商 2 的 斯 塔 克 博 格 博 弈 均衡 产量 
小 于 古 诺 模型 均衡 产量 。 相 应 地 ,厂商 1 的 得 益 有 所 增加 ,而 厂商 2 的 得 益 有 所 减少 。 这 
就 是 所 谓 的 “先行 优势 "。 同 时 ,斯 塔 尔 博 格 模型 的 均衡 产量 和 也 大 于 集体 决策 时 的 最 优 
总 产量 , 即 存在 双边 际 效 应 。 


分 思考 与 练习 


可 见 , 在 得 益 函 数 上 斯 塔 克 博 格 模型 和 十 诺 模型 完全 一 致 ,但 在 行动 次 序 上 存在 差 
别 。 这 种 差别 是 如 何在 分 析 方 法 上 体现 出 来 的 ? 


这 个 例子 也 说 明 ,在 信息 不 对 称 的 博弈 中 ,信息 较 多 的 参与 者 (如 本 博弈 中 的 厂商 2， 
在 决策 之 前 可 先知 道 厂商 1 的 选择 ,因而 拥有 较 多 的 信息 ) 不 一 定 能 得 到 较 多 的 利益 ,而 
这 在 单 人 博弈 中 是 不 可 能 的 。 


3.4.2 抢先 排队 


在 生活 中 我 们 经 常会 遇 到 这 样 的 情况 : 如 果 京 东 的 促销 活动 在 1 个 小 时 之 后 开始 ， 
现在 就 坐 在 电脑 前 等 待 还 是 半 个 小 时 之 后 行动 ? 在 候车 厅 等 待 时 ,提前 多 长 时 间 去 排队 
等 候 检 票 比 较 合适 ? 为 何在 有 些 时 候 又 是 拖 得 越久 越 好 ? 例如 ,许多 动物 的 交配 竞争 体 
现 为 炫 炮 行 为 ,胜利 往往 属于 炫耀 时 间 最 长 的 那 一 个 。 

上 述 问 题 分 别 属于 两 种 不 同 的 类 型 : 抢先 博弈 和 消耗 战 。 前 者 是 大 家 争先 铠 后 ; 而 
后 者 则 是 争 后 铠 先 ,希望 能 坚持 到 最 后 。 看 似 巴 盾 的 两 种 情况 ,仔细 分 析 就 会 发 现 都 是 合 
理 的 结果 。 那 么 在 什么 条 件 下 会 有 争 抢 ,什么 条 件 下 会 有 消耗 ? 本 小 节 和 下 一 小 节 将 分 
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析 两 种 相反 的 结果 是 如 何 形 成 的 ,以 及 什么 时 候 我 们 需要 考虑 先行 优势 ,什么 时 候 又 该 考 
虑 后 动 优势 。 

我 们 经 常 在 火车 站 看 到 图 3-13 所 示 的 场景 。 假 设 有 两 位 乘客 (1 和 2) 在 火车 站 检票 
口 等 待 乘坐 京 沪 高 铁 ,他 们 各 自 面临 着 * 坐 在 座位 上 等 待 * 还 是 “起 身 排队 ?的 选择 。 由 于 
火车 站 客流 量 较 大 , 排 在 前 面 可 以 尽快 上 车 ,相对 而 言 有 较 高 收益 。 但 是 乘客 也 可 以 坐 在 
座位 上 等 待 ,因此 需 考虑 排队 所 花费 的 时 间 和 体力 。 


图 3-13 火车 站 排队 


为 了 简化 博弈 ,假设 只 要 有 一 个 乘客 起 身 排队 , 另 一 个 就 会 紧 随 其 后 。 排 在 队伍 前 面 
的 乘客 的 收益 为 30, 排 在 后 面 的 乘客 的 收益 为 20。 与 排队 相关 的 时 间 成 本 如 表 3-2 所 
示 。 等 待 的 时 间 越 长 ,成 本 越 高 。 如 果 一 位 乘客 已 经 等 待 了 1 个 时 间 单位 , 则 第 二 个 时 间 
单位 的 成 本 是 12 一 5 一 7; 如 果 他 已 经 等 了 两 个 时 间 单 位 , 则 第 三 个 时 间 单 位 的 成 本 是 
21 一 12 一 9。 乘 客 的 最 终 得 益 就 是 他 们 在 队伍 中 所 排 的 位 次 带 来 的 收益 减 去 排队 所 花费 
的 时 间 成 本 。 


表 3-2 排队 博弈 时 间 成 本 对 比 表 


排队 花费 的 时 间 单位 时 间 成 本 排队 花费 的 时 间 单 位 时 间 成 本 
¥ 入 4 32 
2 12 8 45 
3 21 


该 博弈 的 扩展 式 如 图 3-14 所 示 。 乘 客 1 首先 选择 是 否 行动 (排队 ) 还 是 等 待 。 如 果 
他 行动 了 ,那么 博弈 结束 ,他 的 得 益 为 一 15( 排 在 队伍 前 边 的 收益 30 减 去 等 待 所 花费 的 时 
间 成 本 45) ,乘客 2 的 得 益 一 25( 收 益 20 减 去 成 本 45)。 如 果 乘 客 1 等 待 ,那么 乘客 2 选 
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择 是 否 行动 。 如 果 乘 客 2 等 待 就 轮 到 乘客 1 选择 是 否 行动 ,以 此 类 推 。 这 种 情形 最 多 可 
以 持续 5 个 阶段 。 如 果 在 最 后 的 决策 点 乘客 2 选择 等 待 ,我 们 就 认为 队伍 最 前 方 的 乘客 
是 随机 确定 的 。 这 种 情况 下 ,两 位 乘客 的 得 益 均 为 (1/2)X30 十 (1/2)X20 二 25( 此 时 不 存 
在 等 待 成 本 , 排 在 队伍 前 方 或 者 后 方 对 乘客 的 得 益 无 影响 ) 。 


(20,30) (25.25) 
图 3-14 排队 博弈 扩展 式 


现在 用 逆向 归纳 法 分 析 这 个 博弈 。 在 博弈 的 最 后 阶段 ,乘客 2 肯定 会 选择 行动 来 得 
到 较 高 的 得 益 30。 逆 推 至 博弈 的 第 五 阶段 ,乘客 1 在 了 解 乘客 2 的 想法 后 ,会 选择 行动 。 
以 此 类 推 ,在 博弈 的 第 四 阶段 ,乘客 2 会 选择 行动 。 再 逆 推 至 博弈 的 第 三 阶段 ,乘客 1 会 
选择 行动 。 再 通过 逆 推 ,可 知 乘客 2 在 第 二 阶段 会 选择 等 待 ,乘客 1 在 第 一 阶段 也 会 选择 
等 待 。 此 博弈 的 子 博弈 完美 纳什 均衡 为 "等待 /行动 /行动 ,等 待 /行动 /行动 "。 意 即 ,乘客 1 
在 第 一 阶段 选择 等 待 ,乘客 2 在 第 二 阶段 也 选择 等 待 , 乘 客 1 在 第 三 阶段 行动 (排队 )…… 在 
均衡 路 径 上 ,双方 的 得 益 分 别 为 9 和 一 1。 

上 述 子 博弈 完美 纳什 均衡 解释 了 为 何人 们 喜欢 早早 排队 而 不 是 静心 等 候 。 但 是 ,很 
明显 该 子 博 弈 完美 纳什 均衡 的 效率 非常 低 。 如 果 乘 客 们 一 直 等 待 ( 最 后 阶段 乘客 2 行 
动 ) ,那么 乘客 2 可 以 得 到 30 的 收益 ,乘客 1 可 以 得 到 20 的 收益 ,这 个 结果 远 远 优 于 均衡 
结果 。 在 现实 生活 中 ,这 种 低 效率 的 博弈 结果 是 乘客 们 的 急切 心理 造成 的 。 面 对 类 似 情 
况 ,静心 等 修 ,充分 利用 时 间 也 许 是 更 好 的 选择 。 

急切 之 心 人 皆 有 之 ,排队 博弈 中 参与 者 争先 恐 后 的 情况 在 生活 中 也 非常 普遍 。 对 于 
每 一 个 普通 的 高 中 生 而 言 , 大 学 保送 资格 都 极 具 诱 惑 力 。 十 余 载 的 寒窗 苦 读 逐渐 被 量化 
为 一 张 成 绩 单一 个 奥赛 获奖 证 书 、 一 封 校长 推荐 信 等 ,用 以 换取 一 张 梦 塞 以 求 的 录取 通 
知 书 。 为 了 保证 高 校本 科 生 的 生源 质量 ,大 学 挑选 优秀 高 中 生 的 竞争 也 日 趋 激烈 。 对 于 
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大 多 高 校 的 招生 办 公 室 来 说 ,高 考 普通 批 次 招生 已 然 是 "滞后 批 ”。 各 大 高 校 为 了 录取 优 
秀 的 学 生 和 人 学 ,纷纷 推出 少年 班 、 夏 令 营 、 提 前 批 等 措施 ,意图 与 学 生 提前 签署 协议 。 由 于 
高 校 之 间 的 激烈 竞争 ,协议 的 签署 时 间 不 断 提 前 ,甚至 发 展 到 了 参加 竞赛 获奖 的 学 生 刚 进 
高 二 就 被 大 学 提前 录取 的 程度 。 但 这 种 争 抢 战略 背后 的 代价 高 昂 : 高 校 在 不 知晓 学 生 综 
合 素质 和 整体 发 展 的 前 提 下 进行 录取 ,被 录取 的 学 生 又 有 多 少 重演 着 " 伤 仲 永 ”的 悲剧 ; 
这 些 行 动 也 打 乱 了 学 生 的 正常 课程 安排 ,本 可 以 全 面 发 展 的 学 生 为 了 争取 保送 资格 , 却 抛 
弃 其 他 科目 只 专注 竞赛 科目 ,造成 严重 偏 科 。 直 到 近年 来 的 教育 体制 改革 ,保送 资格 要 经 
过 严格 的 综合 素质 考核 ,这 一 现象 才 得 到 改善 。 


3.4.3 讨价还价 


讨价还价 是 市 场 经 济 中 最 常见 .最 普通 的 事情 ,也 是 一 种 典型 的 消耗 战 。 我 们 将 通过 
对 讨价还价 博弈 的 分 析 来 揭示 消耗 战 的 一 般 特 点 。 

讨价还价 博弈 : 假设 有 两 人 就 如 何 分 享 10 000 元 进行 谈判 ,规则 如 下 : 首先 由 甲 提 
出 一 个 分 割 比 例 , 乙 可 以 选择 接受 或 者 拒绝 ; 如 果 乙 拒绝 甲 的 方案 , 则 他 提出 另 一 个 方 
人 案 , 让 甲 选择 接受 与 否 。 博 弈 按 此 规则 不 断 循 环 进行 ,直至 其 中 任何 一 方 接受 对 方 的 方 
案 ,博弈 宣告 结束 。 被 拒绝 的 方案 对 以 后 的 博弈 阶段 没有 影响 。 由 于 谈判 费用 和 利息 损 
失 等 ,讨价还价 每 多 进行 一 个 阶段 ,博弈 双方 的 利益 就 会 有 一 定 损失 。 因 此 ,引入 “ 折 现 因 
子 6”(0 二 6<1),6 也 称 为 消耗 系数 , 即 博弈 每 多 进行 一 个 阶段 ,参与 者 所 得 利益 需 乘 以 8。 

1. 三 阶段 讨价还价 

为 了 简化 问题 ,首先 讨论 一 个 只 有 三 阶段 的 讨价还价 , 即 博弈 进行 到 第 三 阶段 时 乙 必 
须 接受 甲 的 方案 一 一 无 论 结果 如 何 。 具 体 来 说 .博弈 过 程 如 下 。 

第 一 阶段 , 甲 提出 方案 : 自己 得 Si , 乙 得 10000 一 Si 。 如 果 乙 接受 , 则 谈判 结束 ,双方 
的 得 益 分 别 为 S; 和 10 000 一 Si; 如 果 乙 不 接受 , 则 进行 下 一 个 阶段 。 

第 二 阶段 , 乙 提 出 方案 : 甲 得 Ss ,自己 得 10000 一 Ss。 如 果 甲 接受 , 则 谈判 结束 ,双方 
的 实际 得 益 分 别 为 6S 和 8(10 000 一 Ss); 如 果 甲 不 接受 , 则 进行 下 一 阶段 。 

第 三 阶段 , 甲 提 出 方案 : 自己 得 S, 乙 得 10 000 一 S$。 这 时 乙 必 须 接受 ,双方 的 实际 得 
益 分 别 为 8 S 和 62(10 000 一 S)。 

在 求解 均衡 之 前 先 观察 该 博弈 的 特点 。 其 一 是 第 三 阶段 甲 提 出 的 方案 具有 强制 力 ， 
即 当 博 弈 进行 到 该 阶段 时 , 乙 必 须 接受 分 割 比例 S : (10 000 一 S); 其 二 是 该 博弈 每 多 进 
行 一 个 阶段 ,双方 的 总 得 益 就 会 损失 一 定 比 例 , 因 此 谈判 拖 得 越久 对 双方 可 能 越 不 利 。 

现在 求解 该 博弈 的 子 博 弈 纳什 均衡 。 显 然 , 这 是 一 个 无 限 策略 的 动态 博弈 ,无 法 用 标 
准 的 扩展 式 来 表示 。 现 在 ,我 们 先 不 考虑 两 个 参与 者 选择 的 具体 分 割 比 例 ,而 用 一 个 形式 
上 的 扩展 式 来 分 析 。 如 图 3-15 所 示 。 

我 们 仍然 用 逆向 归纳 法 进行 分 析 。 首 先 分 析 第 三 阶段 。 在 此 阶段 中 ,因为 乙 必须 接 
受 , 因 此 甲 会 选择 全 得 , 即 S 二 10 000。 不 过 ,为 了 使 后 续 讨 论 方便 , 仍 沿用 一 般 记号 S。 
这 样 当 博 弈 进行 到 第 三 阶段 时 ,双方 的 实际 得 益 分 别 是 62S 和 656?(10 000 一 S)。 

现在 回 到 第 二 阶段 乙 的 选择 。 乙 已 经 知道 ,如 果 博 弈 进行 到 第 三 阶段 , 甲 将 得 到 82S 
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[65;, 5%10 000-Sj] [Ps 5010 000-5)] 
图 3-15 三 阶段 讨价还价 博弈 


而 自己 得 到 6?(10 000 一 S)。 如 果 此 阶段 乙 所 提 方 案 使 得 甲 的 得 益 Sz 大 于 52S, 那 么 甲 
会 接受 而 不 至 进入 第 三 阶段 。 显 然 ,Sz 越 大 , 甲 选择 接受 的 动机 越 强烈 。 但 是 如 何 才能 
保证 自身 利益 最 优 呢 ?很 不 幸 ,Ss 越 大 , 乙 的 得 益 越 小 。 如 果 Ss 既 能 让 甲 接受 (意味 着 
6S? 三 82S) ,也 能 让 自己 得 益 最 大 (S* 尽 可 能 小 ) ,那么 这 样 的 S* 就 是 最 符合 乙 的 利益 的 。 
因此 乙 的 出 价 5 应 满足 : 6Sz*=62S, 即 Sz 二 8S。 此 时 乙 的 得 益 为 6(10 000 一 Sz ) 一 
10 0006 一 62S。 因 为 0 二 6 一 1 ,因此 该 得 益 与 进行 到 第 三 阶段 的 得 益 8(10 000 一 S) 相 比 
要 大 一 些 ,这 是 乙 可 能 得 到 的 最 大 得 益 。 

最 后 再 回 到 第 一 阶段 甲 的 选择 。 甲 知道 , 若 进行 到 第 二 阶段 自己 将 得 到 82S ,而 乙 则 
会 满足 于 得 到 10 0006 一 62S。 因 此 出 价 Si 应 使 乙 的 得 益 不 低 于 10 0006 一 82S。 类 似 第 
二 阶段 , 甲 的 出 价 Si 应 满足 : 10 000 一 Si 二 10 0006 一 6?S, 即 Si 一 10 000 一 10 0006 十 6?S。 
此 时 , 甲 的 得 益 为 10 000 一 10 0008 十 82S。 因 为 6 二 1 ,该 得 益 比 进行 到 第 二 、 第 三 阶段 的 
得 益 6:S 更 大 。 

综 上 所 述 , 子 博弈 完美 纳什 均衡 所 对 应 的 路 径 为 : 甲 在 第 一 阶段 出 价 Si 一 10 000 一 
10 0008 十 82S, 乙 接受 。 双 方 的 得 益 分 别 为 10 000 一 10 0008 十 82S 和 10 0006 一 62S。 

进一步 讨论 该 博弈 的 均衡 结果 ,可 以 发 现 : 当 甲 在 第 三 阶段 提出 S==10 000 时 ,双方 
的 得 益 分 别 为 10 000(1 一 6 十 8) 和 10 000(6 一 6?)。 此 时 ,双方 获得 利益 的 比例 取决 于 
0 一 虹 的 大 小 。 当 0.5 过 6 二 1 时 ,6 越 大 ,0 一 8 越 小 , 甲 的 得 益 越 大 , 乙 的 得 益 越 小 ; 当 
0 二 6 二 0.5 时 ,6 越 大 ,6 一 6? 越 大 , 甲 的 得 益 越 小 , 乙 的 得 益 越 大 。 这 种 结果 反映 了 在 此 博 
弈 中 乙 赖 以 讨价还价 的 筹码 就 是 可 以 跟 甲 耗 时 间 。 换 言 之 ,虽然 最 终 甲 可 以 争 得 全 部 利 
益 , 但 拖延 时 间 会 给 甲 带 来 损失 。 损 失 越 大 ,耐心 越 小 , 则 甲 愿意 分 给 乙 的 利益 就 越 大 。 

上 述 博弈 问题 及 其 结果 ,在 现实 生活 中 有 许多 例子 ,如 利润 分 配 、 债 务 纠 纷 .商品 交易 
等 ,都 可 以 是 这 个 博弈 模型 的 原型 。 该 模型 的 第 一 、 第 二 阶段 相当 于 纠纷 或 争执 的 各 方 以 
不 同形 式 的 调解 过 程 ,而 第 三 阶段 则 相当 于 最 后 由 仲裁 机 构 或 第 三 方 进 行 裁决 。 模 型 中 
的 折 现 因子 5 则 显示 相关 各 方 花费 在 谈判 和 诉讼 等 方面 的 时 间 、 金 钱 等 代价 。 在 第 6 章 
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将 要 介绍 的 重复 博弈 中 ,9 也 将 作为 重要 的 考量 因素 ,影响 着 参与 者 的 互动 行为 和 策略 。 

2. 无 限 阶段 讨价还价 

无 限 阶段 讨价还价 博弈 在 第 三 阶段 并 不 要 求 强制 结束 ,只 要 双方 互 不 接受 对 方 的 出 
价 方案 ,博弈 就 将 不 断 进 行 下 去 。 奇 数 阶段 由 甲 出 价 乙 选择 是 否 接受 ,偶数 阶段 由 乙 出 价 
甲 选择 是 否 接受 。 

无 限 阶段 与 有 限 阶 段 的 最 大 区 别 在 于 : 前 者 不 存在 可 以 作为 逆向 归纳 法 起 始点 的 最 
后 阶段 。 因 此 按照 通常 的 思路 ,无 法 使 用 逆向 归纳 法 。1984 年 , 夏 克 德 和 萨 顿 提 出 了 一 
种 解决 该 博弈 问题 的 思路 。 思 路 的 要 点 是 : 无 论 从 第 三 阶段 开始 (假如 能 到 达 第 三 阶段 ) 
还 是 从 第 一 阶段 开始 ,对 于 一 个 无 限 阶 段 博弈 ,结果 应 该 是 一 样 的 。 在 无 限 阶段 讨价还价 
中 ,无 论 从 第 一 阶段 开始 还 是 从 第 三 阶段 开始 ,都 由 甲 先 出 价 , 然 后 双方 交 蔡 出 价 ,直到 一 
方 接受 为 止 。 

按照 这 种 思路 ,我 们 可 以 先 把 整个 博弈 的 子 博弈 完美 纳什 均衡 解 假设 出 来 。 假 设 博 
弈 的 解 为 : 甲 在 第 一 阶段 出 价 S, 乙 接受 ,双方 的 得 益 分 别 为 S 和 10 000 一 S。 因 为 从 第 
三 阶段 开始 博弈 与 从 第 一 阶段 开始 应 该 得 到 相同 的 结果 ,所 以 上 述 解 也 是 从 第 三 阶段 开 
始 的 博弈 的 解 。 换 句 话说 ,第 三 阶段 甲 仍 出 价 S, 乙 接受 ,双方 的 得 益 分 别 为 S 和 10 000 一 
S ,并且 这 个 结果 是 最 终结 果 。 

由 于 甲 在 第 三 阶段 的 出 价 是 最 终 出 价 , 因 此 这 个 无 限 阶段 博弈 相当 于 有 强制 结束 的 
三 阶段 讨价还价 。 根 据 前 面 对 三 阶段 讨价还价 博弈 的 讨论 可 知 ,该 博弈 的 解 是 甲 在 第 一 
阶段 出 价 S1 二 10 000 一 10 0006 十 6?S, 乙 接受 。 由 于 这 个 三 阶段 博弈 等 于 从 第 一 阶段 开 
始 的 无 限 阶段 讨价还价 博弈 ,因此 应 有 : S= Si 二 10 000 一 10 0006 十 2S。 从 上 述 方程 可 


解 出 S 二 二 099。 因 此 ,该 无 限 阶 段 讨价还价 的 均衡 结果 是 : 甲 在 第 一 阶段 出 价 S* = 


1 十 》 
10 000 ,0 区 10 000 % 10 0006 
os, 乙 接受 ,双方 的 得 益 分 别 为 于 人 和 2 


前 两 小 节 分 别 介绍 了 动态 博弈 中 的 两 种 常见 类 型 : 抢先 博弈 和 消耗 战 , 现 总 结 
如 下 。 

具体 来 讲 ,抢先 博弈 是 这 样 的 : 每 个 参与 者 要 决定 何 时 采取 行动 。 当 下 列 情况 发 生 
时 参与 者 可 以 获得 较 高 得 益 : 四 先 于 他 人 行动 。 回 对 所 有 参与 者 而 言 ,都 拖延 一 个 阶段 
行动 。 例 如 ,在 诸多 顾客 等 候 服 务 的 排队 问题 上 顾客 如 果 能 坚持 坐等 更 长 时 间 ,还 能 排 到 
队伍 最 前 方 , 那 就 获 益 良 多 。 一 位 乘客 犹 驳 的 时 间 越 长 ,其 他 人 越 有 可 能 先 于 他 行动 。 但 
是 在 多 人 参与 的 情况 下 ,条件 加 很 容易 遭 到 破坏 ,因而 参与 人 为 了 获 益 更 多 转 而 关注 条 件 
中。 所 以 均衡 结果 更 多 地 包含 了 顾客 缺乏 耐心 而 采取 行动 .他 们 在 行动 之 前 没有 足够 的 
时 间 可 等 。 

同样 ,消耗 战 也 是 时 机 博弈 。 但 参与 者 在 以 下 情况 下 能 获得 较 高 的 得 益 : 四 其 他 参 
与 者 较 早 行动 。@ 自 己 较 早 行动 。 特 别 是 ,如 果 一 个 参与 者 想 要 行动 ,在 所 允许 的 范围 
内 ,他 希望 其 他 参与 者 超越 “底线 ?而 首先 行动 。 但 是 如 果 他 打算 超越 底线 ,那么 他 愿意 现 
在 就 行动 而 不 是 以 后 。 一 个 人 等 待 其 他 人 采取 行动 的 时 间 越 长 ,损失 就 越 大 。 其 中 的 关 
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键 问题 是 所 有 参与 者 的 折 现 因子 并 不 是 对 称 的 ,而 且 一 般 不 为 他 人 所 知 。 此 时 ,参与 者 为 
了 多 得 一 点 儿 就 会 逐步 试探 一 -探测 对 方 的 底线 。 这 种 逐步 试探 的 过 程 使 多 阶段 博弈 得 
以 进行 ; 同时 ,最 先 被 探 底 者 将 失去 继续 下 去 的 耐心 ,而 接受 对 方 的 出 价 。 总 体 来 看 , 均 
衡 结果 要 求 参 与 者 有 足够 的 耐心 ,在 行动 之 前 等 待 足够 长 的 时 间 。 
击 )” 游戏 与 实验 

假设 你 正在 与 另 一 位 同学 共同 对 1 000 元 奖金 的 分 配 进行 讨价还价 , 折 现 系数 6 的 
可 能 取 值 为 0.3、0.5、0.7、0.9。 双 方 通过 抽签 的 方式 决定 自己 的 折 现 因子 (双方 的 6 可 
以 相等 ), 且 不 克 许 就 折 现 系数 相互 交流 。 然 后 双方 开始 进行 讨价还价 博弈。 每 2 分钟 为 
一 个 阶段 ,博弈 将 会 随机 停止 。 当 博 蛮 结束 时 ,最 后 一 人 提出 的 分 配方 案 即 为 最 终 方案 。 
统计 各 组 的 实验 结果 ,考察 折 现 系数 6 对 讨价还价 博弈 的 影响 。 


3.4.4 供应 链 中 的 双边 际 效应 “ 


“美国 汽车 业 的 三 大 巨头 每 年 都 要 在 零 部 件 采 购 上 设 定 成 本 削减 目标 ,而 且 会 千 方 百 
计 地 让 这 些 目 标 得 以 实现 ,结果 和 甬 得 供应 商人 心 蛋 怕 。 这 种 情况 一 年 比 一 年 糟糕 。 你 简 
直 不 能 相信 这 些 公司 中 的 任何 人 。” 

一 一 某 汽 车 内 饰 供应 商 主 管 ,公司 客户 包括 福特 、 通 用 汽车 和 克莱斯勒 ,1999 年 10 月 

“本 田 公司 要 求 很 高 ,但 做 生意 极 有 诚意 。 美 国 汽车 制造 商 往往 先 让 我 们 设计 出 产 
品 , 与 其 他 供应 商 竞标 ,然后 将 生意 交 给 报价 最 低 的 供应 商 。 本 田 从 不 这 样 做 事 。” 

一 一 某 工业 用 紧 固件 供应 商 CEO, 公 司 客 户 包括 本 田 公司 、 福 特等 ,2002 年 4 月 

20 世纪 80 年 代 日 本 汽车 大 举 进 入 美国 市 场 , 紧 接着 席卷 全 球 市 场 。 日 本 汽车 业 的 
成 功 ,迫使 美国 汽车 业 ( 也 包括 学 者 和 政府 ) 研 究 .学 习 上 日 本 汽车 业 的 成 功 做 法 。《 改 变 世 
界 的 机 器 ) 一 书 , 就 是 当时 美国 学 者 研究 和 学 习 的 一 个 总 结 。 其 中 一 条 重要 的 经 验 是 , 制 
造 商 要 与 其 供应 商 建立 深层 次 的 合作 关系 ,形成 有 竞争 力 的 价值 链 ( 供 应 链 )。 至 此 ,供应 
链 管理 在 商界 和 学 界 逐 渐 深入 人 心 。“ 供 应 链 管理 "概念 的 提出 是 对 企业 完全 自 利 行动 的 
一 种 叛离 ,因为 自 利 会 导致 经 济 学 中 所 常见 的 "双边 际 效应 ”。 


(生生 儿 :机 了 了 效应 


双边 际 效应 是 指 在 信息 不 对 称 的 情况 下 ,由 于 供应 链 双方 片面 追求 自身 利益 最 大 化 ， 
而 导致 供应 链 的 整体 效益 低 于 供应 链 双 方 利益 之 和 的 现象 。 对 供应 链 内 的 每 个 成 员 而 
言 , 都 将 依照 自己 的 边际 利润 为 零 而 做 出 行动 ,但 是 ,这 种 行动 往往 与 供应 整体 所 对 应 的 
最 优 行动 不 一 致 。 而 这 都 源 于 成 员 企 业 在 独立 决策 时 两 种 边际 所 带 来 的 冲突 ,因此 被 称 

无 论 在 理论 上 还 是 在 实践 中 ,供应 链 管理 都 已 经 取得 了 巨大 的 进展 ,目前 仍然 是 管理 
学 的 国际 前 沿 研 究 领域 之 一 ,也 是 华人 学 者 有 所 成 就 的 领域 之 一 。 供 应 链 管理 的 一 项 重 
要 工作 就 是 刻画 与 分 析 企业 之 间 的 竞争 ,并 通过 机 制 设 计 来 协调 不 同 主体 之 间 的 动机 冲 
突 ,而 主要 研究 工具 就 是 我 们 所 介绍 的 博弈 论 。 接 下 来 我 们 将 借助 博弈 论 建立 一 个 简单 
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的 模型 ,尝试 分 析 这 种 双边 际 效应 是 如 何 产生 的 。 

假设 一 个 汽车 制造 商 向 一 个 零 部 件 供应 商 采购 零 部 件 ,与 其 他 部 件 一 起 加 工 组 装 , 形 
成 一 部 汽车 后 销 往 市 场 。 不 妨 假设 .一 辆 汽车 需要 一 个 零 部 件 。 首 先 ,供应 商 提出 零 部 
件 批发 价 z, 制 造 商 据 此 做 出 反应 ,确定 汽车 的 生产 量 g, 并 依 此 向 供应 商 订购 零 部 件 
gq。 可 以 想象 ,供应 商 的 批发 价 高 . 则 其 单位 利润 高 .但 是 订购 量 有 可 能 会 下 降 。 而 对 
于 制造 商 来 讲 , 供 应 商 的 批发 价 越 低 ,他 的 单位 利润 越 高 。 那 么 产量 呢 , 越 大 对 他 越 有 
利 吗 ? 不 一 定 。 我 们 来 考察 古 诺 模型 的 情况 ,此 时 汽车 的 售 价 可 表示 为 如 下 逆 需 求 
函数 : 


p=A—kg (3-3) 

其 中 人 ,的 含义 与 朝 头 古 诺 模型 中 的 意义 相同 ,A>0。 供 应 商 和 制造 商 的 利润 分 别 为 
Ns = (Ww—cs)g (3-4) 
一 (p—w—cn)g 《3-5》 


其 中 cs ,cm 分 别 为 上 下 游 的 成 本 ,此 处 为 双方 都 知道 的 常数 。 考 虑 到 利润 非 负 , 一 般 要 求 
w 宇 cs ,同时 对 于 给 定 的 名 有 Pp 一 w 一 cm 且 4 过 0。 

至 此 稍 作 停顿 , 理 出 博弈 的 要 素 。 首 先 ,参与 者 为 制造 商 及 其 供应 商 。 其 次 ,参与 者 
的 决策 及 其 策略 空间 。 供 应 商 的 行动 是 连续 变量 ww, 制造 商 的 行动 也 是 连续 变量 g。 而 
其 策略 空间 不 难 计算 ,分 别 为 w 宇 cs 和 0 三 q 过 (A 一 w 一 cm)/k。 对 于 任意 的 策略 组 合 (w， 
q) ,收益 分 别 对 应 式 (3-4) 和 式 (3-5)。 行 动 次 序 则 如 图 3-16 所 示 。 


思考 : 若 用 扩展 型 来 表示 
直 认 ， 会 存在 什么 Ee 


供应 商 确定 批发 价 


fT 有 的 动 ? 
使 用 扩 展 型 来 表示 尼 ? 


制造 商 确定 生产 量 


时 间 


第 1 阶段 第 2 阶段 
图 3-16 ”供应 商 和 有 零售 商行 动 次 序 
既然 博弈 的 要 素 清 楚 了 ,那么 如 何 分 析 均 衡 策略 呢 ? 这 里 仍然 利用 逆向 归纳 法 。 首 
先 , 对 于 任意 给 定 的 ww, 制 造 商都 会 做 出 反应 (决定 自己 的 产量 g) 以 使 自身 利润 最 大 。 将 
式 (3-3) 代 入 式 (3-5) 可 知 xm 是 gq 的 二 次 函数 。 不 难 计 算 , 制 造 商 将 会 把 自己 的 产量 
定 在 


(3-6) 


这 就 是 制造 商 的 反应 函数 。 由 于 信息 完全 ,供应 商 也 能 够 利用 博弈 的 要 素 推 知 制造 商 的 
反应 函数 。 将 式 (3-6) 代 入 式 (3-4) ,供应 商 的 利润 函数 为 zx;(w) 二 (w 一 cs)g(w)。 显 然 ， 
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它 是 z 的 二 次 函数 。 不 难 推 知 , 当 
人 4 (3-7) 
时 ,供应 商 的 利润 最 大 。 而 这 个 推理 对 制造 商 来 说 也 是 透明 的 ,因为 所 有 的 变量 和 成 本 双 
方 都 知道 。 因 此 ,在 供应 商 确定 零 部 件 价格 为 w” 二 cs 十 (A 一 cs 一 cm)/2 之 后 ,制造 商 也 
会 据 此 计算 自己 的 最 优 反 应 g* 。 将 式 (3-7) 代 入 式 (3-6), 可 得 gq* 二 (A 一 cs 一 cm)/(4k)。 
你 从 这 些 优美 的 表达 式 中 发 现 了 什么 ” 式 (3-7) 也 可 表示 为 ww* 一 cs 二 (A 一 cs 一 cm)/2， 
此 即 为 供应 商 的 单位 利润 ,是 潜在 利润 空间 的 一 半 。 而 制造 商 的 单位 利润 p* 一 w* 一 
cm 二 (A 一 cs 一 cm)/4, 是 潜在 利润 空间 一 半 的 一 半 。 此 时 双方 的 利润 分 别 为 
» _ (A—c;—cm)’ » (A—c—cm)? 
本 16k 
供应 商 的 利润 比 制造 商 的 高 ! 对 ,这 就 是 先行 优势 。 
注 : 也 许 你 会 疑惑 ,供应 商 时 常 处 于 被 挤 压 状态 ,怎么 会 有 如 此 丰厚 的 利润 呢 ? 问题 
的 症结 不 在 于 模型 中 间 的 推理 ,而 在 于 模型 的 前 提 : 供应 商 先 动 。 先 动 意味 着 具有 先行 
优势 ,实际 上 并 不 是 所 有 的 供应 商都 如 此 。 若 想 考 察 其 他 类 型 的 供应 链 , 需 要 重建 模型 ， 
改变 供应 商 先 动 的 状况 才 行 。 
至 此 , 仍 未 涉及 双边 际 的 产生 。 让 我 们 来 考察 整个 供应 链 的 最 优 产量 和 利润 。 供 应 
链 的 利润 是 双方 利润 之 和 , 即 


(3-8) 


rc = (pp—ces—cm)g (3=9) 
与 前 类 似 , 可 得 最 优 产量 gq* = 二 (A 一 cs 一 cm)/(2k), 对 应 利润 则 为 x* = 二 (A 一 cs 一 
cm)?/(4k)。 而 零 部 件 批发 价 随便 确定 。 显 然 , 双 方 博弈 的 结果 是 产量 和 利润 都 比 整 链 最 
优 时 低 。 如 果 强 行 让 制造 商 的 产量 等 于 (A 一 cs 一 cm)/(2k) 会 怎么 样 呢 ?显然 ,供应 商 有 
动机 调整 到 tw* ==cs 十 (A 一 cs 一 cm)/2, 而 制造 商 有 动机 调整 到 g* 二 (A 一 cs 一 cm)/(4k)。 
意味 着 双方 还 是 回 到 这 种 低 效 状态 一 一 只 是 从 整体 最 优 的 角度 来 判定 。 这 就 是 经 济 学 中 
所 常见 的 “双边 际 效应 ”。 通 俗 地 讲 ,双方 都 会 为 了 自己 的 最 优 而 御 牲 掉 整 体 的 最 优 。 能 
否 想 办 法 既 能 整体 最 优 、 又 使 得 双方 的 动机 不 冲突 呢 ? 回答 是 能 ,但 不 是 这 种 常见 的 批发 
价 协议 。 如 果 你 感 兴趣 ,可 以 翻阅 更 多 供应 链 管 理 的 书籍 ,了 解 相 关 学 者 和 实践 者 是 如 何 
通过 机 制 设 计 来 降低 双边 际 效用 从 而 提高 整个 供应 链 绩效 的 。 


3.4.5 边缘 政策 * 


“冷战 "期间, 许多 人 认为 北约 和 华 约 之 间 的 常规 力量 平衡 并 不 是 很 重要 。 具 体 而 言 ， 
“有 核 国 家 ”之 间 的 威慑 取决 于 决议 的 平衡 . 即 拥有 核武 器 的 各 国 对 承担 核 战 争 升 级 的 风 
险 的 相对 意愿 ,而 不 是 取决 于 军事 力量 (简称 “军力 ”) 的 平衡 。 考 庸 讳言 ,两 个 核 大 国美 国 
和 苏联 拥有 庞大 的 核武 器 库 , 核 战争 升级 的 风险 当然 也 非常 高 ,因而 军力 间 的 平衡 就 相形 
见 纳 了 。 但 是 , 除 此 之 外 国家 间 的 军力 平衡 也 是 如 此 无 关 紧要 吗 ? 还 有 一 个 更 为 普遍 的 
问题 : 军力 平衡 如 何 影响 有 核 国 家 之 间 的 核 威 慑 和 事态 升级 ? 

一 般 而 言 , 核 边缘 政策 理论 认为 军力 的 平衡 对 核 威慑 并 没有 多 大 影响 。 依 照 这 种 让 
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辑 ,军力 平衡 没有 什么 实际 作用 。 然 而 ,这 种 理论 与 实际 危机 的 特点 相 了 矛盾 。 例 如 ,处 于 
核 危机 中 的 国家 常 左右 权衡 : 使 用 更 多 的 军事 打击 ,还 是 加 大 核 战 升 级 的 风险 。 在 决定 
是 否 升级 战争 时 ,国家 通常 可 采取 措施 以 使 其 军事 潜能 更 充分 发 挥 。 如 果 后 续 的 战争 仍 
然 只 是 局 部 的 ,并 且 冲 突 不 会 升级 为 灾难 性 的 核 战 争 ,这 样 做 便 会 增加 获胜 的 可 能 性 。 但 
这 些 措施 也 可 能 使 危机 演变 为 另 一 种 灾难 。 

在 1999 年 的 卡 吉尔 战争 中 ,印度 就 曾 面临 军事 力量 和 战争 升级 风险 之 间 的 权衡 。 卡 
吉尔 战争 是 印 巴 两 国 在 印 控 克 什 米尔 的 卡 吉尔 地 区 爆发 的 边境 冲突 。 这 次 冲突 是 双方 自 
1988 年 以 来 无 数 次 小 型 冲突 中 最 为 严重 的 一 次 。1999 年 初 ,巴基斯坦 的 军队 偷偷 越过 控 
制 线 , 占 领 了 前 沿 阵 地 ,并 俯 葡 印度 的 国道 1A 一 一 赛 肯 (Saichen) 冰 川 地 区 印度 军 方 的 重 
要 补给 线 。 同 年 5 月 初 ,印度 方面 了 解 到 这 次 入 侵 , 并 发 起 了 一 次 驱逐 巴基斯坦 军队 的 攻 
击 。 由 于 担心 战争 进一步 扩大 ,印度 当局 做 出 了 两 个 关键 决定 。 

首先 ,他 们 命令 印度 地 面部 队 留 在 控制 线 的 印度 一 侧 , 不 能 跨越 国际 边境 线 扩大 战 
争 。 这 种 阻止 地 面 冲突 扩大 的 方式 降低 了 核 战争 升级 的 风险 ,但 这 一 决定 意味 着 印度 军 
队 将 在 非常 不 利 的 条 件 下 战斗 ,不 但 降低 了 成 功 的 可 能 性 ,而 且 也 提高 了 成 本 。 

其 次 ,印度 当局 允许 使 用 空中 力量 ,但 是 将 其 活动 区 域 限制 在 控制 线 的 印度 一 侧 。 自 
1971 年 战争 以 来 ,印度 就 没有 使 用 过 空中 力量 打击 巴基斯坦 。 出 于 对 战争 升级 的 担心 ， 
印度 政治 领导 人 最 初 拒绝 了 在 部 分 地 区 使 用 空中 力量 的 申请 。 但 是 ,在 最 初 获 取 巴 基 斯 
坦 阵地 的 尝试 失败 后 ,印度 当局 决定 承担 风险 ,赞成 使 用 空中 力量 。 但 是 ,这 些 领导 人 只 
愿意 到 此 为 止 。 这 两 个 关键 的 决定 体现 了 印度 希望 在 维持 局 部 冲突 的 前 提 下 提高 成 功 概 
率 的 意愿 ,其 意图 是 反对 扩大 战争 ,阻止 战争 失控 。 

美国 和 苏联 在 古巴 导弹 危机 中 也 面临 着 同样 的 权衡 .了 在 危机 的 早期 阶段 ,肯尼迪 
总 统 的 顾问 们 争论 的 焦点 是 对 导弹 基地 发 动 军事 打击 。 发 动 军事 打击 可 以 消除 核 导弹 ， 
但 这 将 增加 战争 升级 乃至 发 动 核 战 争 的 风险 。 正 如 肯尼迪 总 统 向 国会 领导 人 解释 的 那 
样 : 如 果 我 们 入 侵 ,我 们 就 必须 考虑 解除 他 们 武器 时 要 承担 的 风险 。 

克里姆林 宫 的 领导 人 也 面临 着 类 似 的 权衡 。 在 了 解 到 肯尼迪 将 在 古巴 做 演讲 之 后 ， 
面 对 这 个 “迫在眉睫 ”的 美国 人 侵 事 件 ,苏联 主席 团 的 成 员 很 快 便 开 始 讨论 如 何 给 在 古巴 
的 苏联 指挥 官 下 达 指 示 。 除 非 被 授权 使 用 战略 核武 器 ,否则 苏联 军队 将 面临 几乎 必然 的 
失败 。 但 是 这 些 领导 人 担心 使 用 核武 器 会 引发 核 战 争 , 所 以 他 们 最 终 决 定 : 暂 不 授予 军 
队 使 用 核武 器 的 权利 。 

军力 平衡 是 否 以 及 如 何 影响 战争 的 升级 ,一直 是 核 威 慑 理论 中 甚而 未 决 的 问题 。 为 
什么 近 几 十 年 来 ,高 水 平 的 暴力 冲突 减少 ,但 小 规模 的 暴力 冲突 却 增加 了 ? 为 什么 不 同 的 
国家 采取 不 同 的 核 理 论 和 武力 姿态 ? 军事 力量 和 风险 之 间 是 怎样 的 利害 关系 ,又 是 否 存 
在 均衡 呢 ? 下 面 将 从 博弈 论 的 视角 来 介绍 这 些 问题 。 

假设 挑 蛇 者 C 考虑 使 用 武力 达成 目标 。 为 了 简化 模型 ,假设 挑 评 者 C 决定 侵占 防卫 
者 DD 的 一 些 领 土 。 在 冲突 没有 升级 到 核 战 争 的 前 提 下 , 挑 蛇 者 使 用 的 军事 力量 越 强大 ， 


@ “小 约瑟夫 。 哈 林 顿 曾 对 这 次 危机 进行 了 建 模 描述 ,可 参阅 ( 哈 林 顿 博弈 论 ) 相 关 章节 。 
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获得 领土 的 可 能 性 就 越 高 。 但 是 增加 军力 也 会 增加 冲突 升级 的 风险 。 挑 蛇 者 决定 所 使 用 
的 军力 规模 后 ,防卫 者 决定 是 否 利用 这 个 机 会 升级 冲突 。 如 果 利 用 这 种 机 会 ,那么 防卫 者 
需要 决定 引发 多 大 的 风险 才 是 恰当 的 。 

该 博弈 的 扩展 式 如 图 3-17 所 示 ,以 挑 鲜 者 选择 接受 现状 或 挑 古 开始 。 如 果 没 有 挑 
鲜 ,那么 博弈 结束 。 防 卫 者 保持 着 领土 的 控制 权 , 得 益 ( 对 应 图 中 得 益 组 合 的 第 二 行 ), 而 
挑 央 者 的 得 益 为 0( 对 应 图 中 得 益 组 合 的 第 一 行 )。 


万 tp) 
CcC/\P D/ANr C 坚持 D 坚持 
= 人 一 一 
Sy (1—r)pvc-ke)-r(ketnc) 
现状 也 退出 退出 (Dl(1-p)vc-ke]-r(kptnp) 
0 
0 


ap) |[0-xplec-ko-rpXkctno) 
[0I-zC)]O-kp)-zP)Xkp+mp) 
vp 


[=rO)](~ke) -rpAkctnc) 
[0-zo)]wp-fp)-rP)Mkp+np) 


图 3-17 核 边缘 政策 和 军事 力量 博弈 的 扩展 式 


挑 蛇 者 使 用 军事 力量 挑 蛇 现状 ,并 开始 战斗 。 形 式 上 , 挑 内 者 选择 PE (0,5]。p 表 
示 挑 妊 者 获胜 的 概率 (意味 着 危机 仍然 在 控制 中 ,不 会 发 展 到 核 战争 ) ,防卫 者 获胜 的 概率 
就 是 1 一 p。p 越 大 ,对 应 挑 蛇 者 可 能 使 用 越 多 的 军力 ,在 危机 可 控 时 结果 也 会 越 好 。 上 
界 5 是 挑 蛇 者 使 用 全 部 军力 时 获胜 的 概率 。 同 时 ,战争 (对 任何 p 二 0) 会 给 挑 内 者 和 防卫 
者 分 别 带 来 消耗 Re 和 Ap 。 一 旦 挑 餐 者 决定 了 思 , 防 卫 者 就 要 决定 引发 多 大 的 风险 。 形 式 
上 , 当 两 个 国家 都 不 退出 战斗 时 ,防卫 者 选择 r 来 表示 危机 失控 的 风险 概率 。 了 

该 博弈 的 特点 是 , 挑 蛇 者 所 使 用 的 军力 规模 影响 着 冲突 的 稳定 性 .8 具体 来 讲 , 挑 峡 
者 使 用 多 少 军力 ,防卫 者 的 行动 就 会 产生 多 大 风险 。 如 果 挑 蛇 者 选择 了 pp. 那 么 防卫 者 一 
定 会 选择 一 个 r(r€ELr(p),7(p))), 

上 限 关 (2) 是 挑 鲜 者 选择 p 时 的 潜在 最 大 风险 。 因 此 在 博弈 中 ,防卫 者 可 以 努力 使 实 
际 风险 提高 至 这 个 水 平 ,来 迫使 挑 峡 者 后 退 。 六 (2) 越 大 ,潜在 的 风险 越 大 ,冲突 就 越 不 稳 
定 。 假 设 挑 内 者 不 使 用 武力 时 ,承担 的 潜在 风险 "(p) 是 0, 并 且 风 险 以 越 来 越 快 的 速度 随 
着 军力 的 增加 而 增加 。 用 符号 表示 ,就 是 (0) 二 0,7'(p) 这 0,7”(p) 记 0, 其 中 rx(，) 和 
必 (。) 分 别 表示 一 阶 和 二 阶 导数 。 当 然 ,.0 一 Fr() 到 1。 


@ 实际 上 ,防卫 者 并 不 是 真正 选择 风险 概率 ~, 而 是 用 很 多 不 同 的 方式 回应 挑 鲜 者 的 行动 ,不 同 的 方式 相应 地 产 
生 不 同 的 风险 。 例 如 ,克里姆林 宫 是 否 授权 在 古巴 使 用 战略 核武 器 对 美国 的 入侵 最 终 升级 为 全 面 战争 的 可 能 性 有 很 
大 影响 。 事 实 上 , 正 是 这 种 效果 使 得 克里姆林 宫 放弃 批准 战略 核武 器 的 使 用 。 为 了 简化 模型 ,我们 用 风险 概率 - 代替 
不 同行 动产 生 的 风险 。 

回 ”这 种 结论 建立 在 对 卡 吉尔 战争 和 古巴 导弹 危机 的 讨论 上 。 提 高 军事 成 功率 的 行动 ,如 越过 控制 线 ,或 攻击 古 
巴 导弹 ,似乎 也 创造 了 更 大 的 潜在 风险 。 
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下 限 x(p) 是 当 挑 内 者 选择 p 时 存在 的 固有 风险 , 即 当 获胜 概率 为 p 时 ,最 小 的 或 不 
可 避免 的 风险 。 我 们 认为 在 p 为 0 时 x(p) 二 0, 并 且 x(p) 以 一 个 缓慢 增加 的 速度 随 p 增 
加 , 即 x(0) 二 0,r (Pp) 宇 0,x(p) 宇 0[r(p) 二 1]。 风 险 概 率 的 可 选 范 围 [7 (p) 一 r(p)], 也 被 
认为 是 以 越 来 越 快 的 速度 增加 。 满 足 这 些 条 件 的 一 个 简单 例子 是 : r(p) 二 hp?,7(p) 王 
hp? hh) 

在 描述 了 博弈 的 最 后 两 个 阶段 后 ,我 们 再 进一步 阐述 风险 函数 (图 3-18)。 一 旦 挑 量 
者 选择 了 户 ,防卫 者 选择 了 ~。 挑 盱 者 将 选择 退出 战斗 或 者 坚持 战斗 。 退 出 战斗 的 好 处 是 
挑 鲜 方 只 需 承担 固有 风险 ~(z) 而 不 用 承担 可 能 的 更 高 风险 ~。 缺 点 是 挑 峡 者 将 放弃 获得 
领土 的 机 会 。 如 果 停 止 战斗 , 挑 内 者 的 预期 得 益 是 [1 一 r(p)](0 一 kc) 一 r(p) (kc 二 nc) 
Gzc 为 如 果 爆 发 全 面 核 战 争 的 额外 费用 ) 。 如 果 挑 是 者 停止 战斗 并 且 事态 可 控 , 防 卫 者 将 
成 功 保卫 领土 ,他 的 得 益 为 [1 一 x(p)](Cvp 一 kp) 一 r(p)(kp 十 np)。 


D 选 择 风 险 概率 r 


Ap) 


1 

1 

1 D 的 选择 r 必 须 在 
rP) 和 Fp) 之 间 
1 

1 

1 

1 


r(p) 
C 选 择 获胜 概率 p 
图 3-18 ”风险 函数 


如 果 挑 鲜 者 立场 坚定 , 则 防卫 者 将 决定 是 否 退 出 战斗 。 如 果 退 出 战斗 , 挑 台 者 和 防卫 
者 的 得 益 分 别 为 [1 一 r(p)]Cvc 一 kc) 一 r(p) (kc 十 nc) 和 [1 一 r(p)](0 一 kp) 一 r(p) (kp 
np)。 如 果 双 方 均 坚持 战斗 ,在 争夺 领土 的 战争 中 , 挑 蛇 者 将 以 概率 p 获胜 。 也 就 是 说 ， 
只 要 事态 仍然 可 控 , 挑 峡 者 将 获得 p(vc 一 kc) 十 (1 一 p)(0 一 kc) 二 pvc 一 kc。 但 事态 可 控 
的 概率 为 1 一 r"。 因 此 ,如 果 双 方 都 坚持 战斗 ,那么 最 终 挑 央 者 的 得 益 为 (1 一) (pvc 一 kc) 一 
rlkc 十 nc) ,防卫 者 的 得 益 为 (1 一 站)[ (1 一 p)(vp 一 kD) 十 p(0 一 kp)] 一 r(kD 十 nD)。 

人 们 不 能 以 发 动 某 个 灾难 的 方式 ,作为 给 别人 施加 强制 性 压力 、 进 而 获 利 的 手段 。 但 
是 ,人 们 可 以 造成 引发 共同 灾难 的 适度 风险 。“ 摇 船 ” 就 是 一 个 很 好 的 例子 。 假 如 甲乙 同 
船 对 抗 , 甲 对 乙 说 :“ 停 ! 否则 我 让 船 翻 倒 , 咱 俩 同归于尽 !1” 乙 不 会 相信 ,因为 甲 不 可 能 真 
的 令 船 翻 倒 ,牺牲 自己 。 但 是 ,如 果 甲 开始 摇动 船 , 使 它 有 可 能 翻 倒 (并 不 是 因为 甲 希望 它 
翻 倒 , 而 是 一 旦 甲 开始 播 船 ,他 便 不 能 完全 控制 这 稻 船 了 ) ,情况 就 会 大 不 相同 。 

这 一 招 在 国际 关系 中 有 着 广泛 的 应 用 ,如 核 威 慨 。 发 展 核武 器 与 尖端 武器 不 是 为 了 
使 用 ,而 是 为 了 增强 自己 的 威慑 力 , 它 们 反而 使 世界 更 加 和 平 了 。 一旦 威胁 是 可 信和 的 , 威 
胁 所 蕴含 的 事实 反而 不 会 发 生 。 博 弈 的 结局 就 是 这 样 , 往 往 由 可 能 发 生 但 一 直 没 有 发 生 
的 事情 所 左右 。 
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3.5 动态 博弈 的 扩展 讨论 ” 


在 前 面 几 节 中 ,我 们 介绍 了 逆向 归纳 法 和 子 博弈 完美 纳什 均衡 ,并 利用 这 两 个 概念 讨 
论 了 一 些 经 典 案例 。 本 节 将 对 动态 博弈 做 进一步 的 讨论 。 一 方面 ,除了 我 们 已 经 介绍 的 
几 个 经 典 模型 外 ,动态 博弈 还 有 很 多 类 型 。 本 节 将 介绍 一 类 有 同时 行动 的 动态 博弈 模型 ， 
这 种 模型 至 少 在 博弈 的 某 个 阶段 中 存在 着 参与 者 的 同时 行动 。 另 一 方面 ,尽管 逆向 归纳 
法 和 子 博弈 完美 概念 在 简单 的 两 阶段 博弈 中 似乎 很 有 说 服 力 , 比 如 斯 塔 克 博 格 模型 ,但 这 
并 不 意味 着 它们 克服 了 相机 选择 给 动态 博弈 分 析 所 造成 的 困难 。 如 果 有 多 个 参与 者 或 每 
一 个 参与 者 有 多 次 行动 ,情况 就 变 得 复杂 多 了 。 本 节 将 通过 一 些 案例 讨论 逆向 归纳 法 和 
子 博弈 完美 纳 会 均衡 作为 行为 理性 的 一 些 局 限 性 ,并 简单 介绍 颤 拌 手 均衡 等 思想 ,以 使 读 
者 对 动态 博弈 分 析 有 更 深入 的 了 解 。 


3.5.1 有 同时 行动 的 动态 博弈 


< 引 语 故事 : 希腊 银行 挤兑 


纵 观 2015 全 年 ,欧盟 可 谓 渡 尽 动 波 。 其 中 ,关于 希腊 濒临 国家 破产 的 新 闻 几 乎 占领 
了 每 天 的 头条 : 国际 债务 到 期 和 养老 金 暂停 发 放 使 得 希腊 的 银行 腹背受敌 ,面临 着 史 无 
前 例 的 挤兑 风险 ,一 旦 银行 破产 希腊 将 朝 不 保 夕 。 

当地 时 间 6 月 28 日 ,希腊 总 理 齐 普 拉 斯 发 表 电视 讲话 称 , 希 腊 各 银行 将 根据 中 央 银 
行 的 建议 停止 对 外 营业 并 实行 资本 管制 。 作 为 应 对 危机 措施 的 一 部 分 ,雅典 证 券 交易 所 
周一 也 将 关闭 。 很 多 希腊 民众 由 于 担心 希腊 退出 欧元 区 ,银行 遭遇 破产 ,在 ATM 机 前 排 
起 长 队 挤 兑 资金 (图 3-19)。 仅 6 月 27 日 一 天 时 间 , 和 希腊 全 国有 超过 1/3 的 自动 取款 机 
被 取 空 现金 ,银行 系统 有 大 约 6 亿 欧元 现 钞 被 民众 提 走 。 


信任 是 银行 业 运转 的 根基 ,每 一 笔 看 似 简单 的 信贷 业务 都 由 银行 与 客户 之 间 的 信任 
背书 。 银 行 的 信贷 业务 在 给 银行 和 整个 社会 带 来 巨大 收益 的 同时 ,也 孕育 着 巨大 的 风险 。 
一 且 客 户 丧 失 对 银行 的 信任 ,就 会 纷纷 不 再 存款 、 争 相 提 款 。 此 举 的 传染 性 可 能 造成 银行 
的 破产 ,产生 影响 宏观 经 济 的 系统 性 风险 ,甚至 造成 金融 危机 。 本 小 节 将 通过 一 个 博弈 模 
型 来 介绍 其 内 在 相互 作用 机 制 。 

一 家 银行 为 了 给 一 个 企业 发 放 一 笔 20 000 元 的 贷款 ,以 20% 的 年 利率 吸引 客户 的 存 
款 。 若 两 个 客户 各 有 10 000 元 的 资金 ,并 把 资金 以 1 年 期 定期 存款 存 人 该 银行 ,那么 银 
行 就 可 以 向 企业 发 放贷 款 。 若 至 少 一 个 客户 不 愿 存款 ,那么 银行 将 无 法 给 企业 贷款 ,但 客 
户 们 都 能 保住 自己 的 本 金 。 

在 两 个 客户 都 存款 时 ,银行 准时 发 放贷 款 , 企 业 正常 投入 生产 ,银行 得 以 收回 贷款 本 


@ 资料 来 源 : 中 新 网 ,2015 年 6 月 29 日 .( 希 腊 总 理 宣布 银行 停摆 实行 资本 管制 )。 


图 3-19 民众 挤兑 希腊 银行 ATM 机 资金 


息 来 支付 客户 的 存款 本 息 。 但 是 若 有 一 个 客户 单独 或 者 两 个 客户 同时 要 求 提 前 取出 存 
款 , 银 行 就 不 得 不 提前 收回 贷款 ,企业 就 无 法 保证 生产 。 假 设 此 时 银行 只 能 收回 80% 的 
本 钱 。 若 一 个 客户 要 求 提前 取款 , 则 银行 偿还 其 全 部 本 金 , 余 款 则 属于 另 一 客户 ; 若 两 个 
客户 同时 要 求 提前 取款 , 则 平分 回收 的 资金 (假设 银行 不 收 任何 佣金 和 手续 费 ) 。 

现在 ,建立 博弈 模型 。 因 为 只 有 两 位 客户 先 选择 是 否 存款 ,才能 进一步 考虑 是 否 提前 
取款 ,因此 这 是 一 个 动态 博弈 问题 。 第 一 阶段 ,两 个 客户 各 自选 择 是 否 存款 。 由 于 两 个 客 
户 互 不 了 解 , 因 此 可 视 作 静 态 博 弈 , 即 两 个 客户 同时 选择 是 否 存款 。 同 样 , 第 二 阶段 也 是 
一 个 静态 博弈 , 即 两 个 客户 同时 选择 是 否 提前 取款 。 因 此 这 是 一 个 包含 同时 行动 的 两 阶 
段 动态 博弈 。 为 了 便于 分 析 , 将 该 博弈 用 图 3-20 所 示 的 两 个 得 益 和 矩阵 表示 。 


客户 2 
不 存 存款 
不 存 1,1 1 
客户 1 
存款 | 1,1 | 1,1 | 
(a) 第 一 阶段 
客户 2 
提前 到 期 
提前 0.8.0.8 1.0.6 
客户 1 
到 期 0.6.1 Tl 
(b) 第 二 阶段 


图 3-20 间接 融资 博弈 


用 逆向 归纳 法 来 分 析 这 个 博弈 。 第 二 阶段 的 静态 子 博弈 存在 两 个 纯 策 略 纳什 均衡 
(提前 ,提前 ) 和 (到 期 ,到 期 ) ,分 别 对 应 得 益 (0.8,0.8) 和 (1.2.1.2)。 显 然 ,后 一 个 帕 累 托 
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优 于 前 一 个 。 通 常情 况 下 该 博弈 的 结果 是 (到 期 ,到 期 ), 双 方 得 益 为 (1.2,1.2)。 换 言 之 ， 
两 个 客户 都 等 到 存款 到 期 后 去 取款 ,收回 本 金 并 获得 利息 。 但 只 要 有 一 个 客户 认为 另 一 
客户 有 提前 取款 的 可 能 ,那么 前 者 的 合理 行动 就 不 再 是 到 期 取款 ,而 是 提前 取款 。 因 此 上 
述 高 效率 的 均衡 往往 难以 实现 ,结果 导致 男 一 个 低 效率 的 纳什 均衡 。 

回 到 第 一 阶段 ,两 个 客户 是 否 存款 。 如 果 第 二 阶段 的 博弈 结果 是 高 效率 的 (到 期 ,到 
期 ) ,那么 第 一 阶段 的 博弈 如 图 3-21 所 示 。 

此 时 第 一 阶段 也 有 两 个 纳什 均衡 : (不 存 , 不 存 ) 和 (存款 ,存款 )。 显 然 ,后 者 帕 累 托 
优 于 前 者 。 因 此 两 个 客户 都 会 选择 存款 ,这 对 应 于 银行 间接 融资 制度 很 好 起 作用 的 情况 。 

如 果 第 二 阶段 的 博弈 结果 是 低 效 率 的 (提前 ,提前 ) ,那么 第 一 阶段 的 博弈 如 图 3-22 
所 示 。 

客户 2 客户 2 
不 存 存款 不 存 存款 


存款 [二 | 1.2,12 客户 1 存款 1,1 0.8.0.8 


图 3-21 间接 融资 的 第 一 阶段 等 价 博弈 (一 ) 图 3-22 间接 融资 博弈 第 一 阶段 等 价 博弈 (二 ) 


此 时 (不 存 ,不 存 ) 是 两 个 客户 的 最 佳 选择 。 这 对 应 于 客户 不 再 信任 银行 ,银行 系统 崩 
溃 的 情况 。 但 这 种 情况 本 身 却 不 会 引起 银行 挤兑 的 风潮 和 金融 危机 ,因为 在 这 种 情况 下 
客户 根本 没有 把 资金 存 人 银行 。 

事实 上 ,导致 银行 挤 况 风潮 或 金融 危机 的 内 在 机 制 是 这 样 的 : 由 于 第 二 阶段 的 结果 
其 实 是 不 确定 的 ,因此 客户 在 第 一 阶段 时 并 不 能 完全 肯定 第 二 阶段 会 出 现 哪 种 结果 。 这 
就 意味 着 客户 是 以 第 二 阶段 的 (到 期 ,到 期 ) 为 预期 而 在 第 一 阶段 选择 了 (存款 ,存款 )。 但 
在 第 二 阶段 ,由 于 谣传 引起 的 恐慌 等 原因 ,客户 纷纷 提前 提 款 ,导致 最 终 出 现 的 是 (提前 ， 
提前 )。 这 正 是 现实 生活 中 许多 “银行 挤兑" 风潮 的 制度 性 根源 ,严重 者 将 导致 银行 倒闭 。 

上 述 间接 融资 博弈 揭示 了 经 济 决策 中 一 类 低 效率 均衡 存在 的 原因 。 为 了 保证 或 促进 
高 效率 均衡 的 实现 ,需要 借助 保险 制度 和 政府 权威 机 构 的 调控 。 这 就 是 为 什么 政府 要 建 
立信 贷 保证 .保险 制度 ,对 存款 进行 保护 .保险 的 原因 。 

根据 上 述 间 接 融资 模型 ,可 归纳 出 一 个 有 同时 行动 的 两 阶段 动态 博弈 标准 模型 。 

(1) 博 讲 中 有 4 个 参与 者 ,分 别称 为 参与 者 1 .参与 者 2、 参与 者 3、 参 与 者 4。 

(2) 第 一 阶段 是 参与 者 1 和 参与 者 2 同时 行动 ,他 们 同时 在 各 自 的 可 选 策略 (行动 ) 
集合 中 分 别 选 行动 。 

(3) 第 二 阶段 是 参与 者 3 和 参与 者 4 同时 行动 ,他 们 在 观察 到 参与 者 1 和 参与 者 2 
的 行动 之 后 ,同时 在 各 自 的 可 选 策略 (行动 ) 集 合 中 做 出 反应 。 

(4) 各 参与 者 的 得 益 都 取决 于 所 有 参与 者 的 行动 , 即 任 一 参与 者 的 得 其 都 是 所 有 参 
与 者 行动 的 一 个 多 元 函数 。 

现实 生活 中 的 具体 博弈 可 看 作 上 述 标准 模型 的 具体 化 。 当 然 , 不 同 的 博弈 会 有 不 同 
的 特点 。 例 如 ,在 博弈 的 第 一 或 第 二 阶段 只 有 一 个 参与 者 ,或 者 前 后 两 个 阶段 的 参与 者 相 
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同 ( 如 上 述 间接 融资 博弈 ) ,这 些 差 别 并 不 影响 模型 的 基本 分 析 方法 。 
除了 有 同时 行动 的 动态 博弈 外 ,还 存在 另 一 种 常见 的 动态 博弈 类 型 : 重复 博弈 。 鉴 
于 重复 博弈 的 重要 性 和 系统 性 ,第 6 章 将 有 详细 介绍 。 


3.5.2 逆向 归纳 法 的 局 限 性 


< 引 语 故事 ，( 隆 中 对 ) 的 战略 远见 


《 隆 中 对 》 作 为 千古 名 篇 广 为 人 识 , 其 中 的 军事 谋略 在 中 国 古 代 战 略 思想 中 具有 典范 
价值 。 作 为 诸葛 亮 初 登 政 治 舞 台 为 刘备 描述 的 战略 远景 人 ( 隆 中 对 》 可 分 为 前 后 两 部 分 , 主 
旨 各 不 同 , 但 其 要 义 辟 在 联 买 抗 草 。 在 当时 ,除了 重 肃 等 几 位 政治 家 与 其 见解 相同 外 , 即 
使 诸葛 亮 身边 的 人 也 不 能 深刻 认识 到 这 一 点 一 一 包括 知人 善 任 之 人 如 刘备 .足智多谋 猛 
将 如 关羽 等 。 例 如 ,孔明 在 离开 斌 州 时 曾 问 关羽 :“ 倘 曹操 引 兵 来 到 ,应 当 如 何 ?关羽 对 
目 :“ 以 力 拒 之 。" 孔 明 又 问 :“ 倘 曹操 孙权, 齐 起 兵 来 ,该 当 如 何 ?” 关 羽 说 :“ 分 兵 拒 之 。 
孔明 听 后 说 :“ 如 果 这 样 ,荆州 危 妆 。" 于 是 ,孔明 告诉 关羽 " 北 拒 曹操 , 东 和 孙权 ”的 八字 方 
针 。 和 毛泽东 主席 曾 直言 ,诸葛 亮 让 关羽 守 斌 州 是 一 招 错 棋 ! 其 根源 就 在 于 : 刘备 谨慎 ,从 
战略 上 提防 东 吴 ,不 能 完全 地 达成 攻守 同盟 ; 关羽 骄傲 ,从 思想 上 看 不 起 东 吴 ,不 能 认真 
贯彻 执行 联 吴 抗 草 的 战略 方针 ; 此 二 人 这 样 行事 就 从 根本 上 否定 了 诸葛 亮 的 战略 意图 。 
可 见 , 即 使 诸葛 亮 联 买 抗 草 的 谋略 具有 远见 卓识 ,但 并 没有 为 众人 所 共 见 ,他 身边 的 盖世 
英豪 也 概 英 能 外 。 


引 语 故 事 提 出 了 一 个 问题 : 参与 者 是 否 具 有 足够 的 远见 以 预测 未 来 。 实 际 上 ,大 多 
数 博弈 的 参与 者 只 具备 有 限 的 能 力 进行 “向 前 展望 , 倒 后 推理 ”。 动 态 博弈 分 析 的 中 心 内 
容 是 子 博弈 完美 均衡 分 析 ,而 子 博弈 完美 均衡 分 析 的 核心 方法 便 是 逆向 归纳 法 。 逆 向 归 
纳 法 思路 清晰 ,并 能 得 出 明确 的 结论 ,是 一 种 很 高 效 的 工具 。 但 是 ,北向 归纳 法 在 进行 “向 
前 展望 , 倒 后 推理 ”时 同样 存在 很 多 弱点 ,包括 以 下 几 个 。 

(1) 道 向 归纳 法 只 能 分 析 明 确 设 定 的 博弈 问题 ,要 求 对 博弈 的 结构 ,包括 次 序 、 规 则 
和 得 益 情况 等 都 非常 清楚 ,并 且 各 个 参与 者 了 解 博弈 结构 ,相互 知道 对 方 了 解 博弈 结构 。 
而 现实 中 的 大 量 问 题 并 不 具有 如 此 清晰 的 特征 。 

(2) 道 向 归纳 法 也 不 能 分 析 比 较 复杂 的 动态 博弈 (如 有 多 个 参与 者 或 每 一 个 参与 者 
有 多 次 行动 ) ,如 象棋 、 围 棋 等 。 

(3) 在 遇 到 两 条 路 径 的 利益 相同 时 ,逆向 归纳 法 也 会 发 生 选 择 困 难 。 

(4) 道 向 归纳 法 对 参与 者 的 理性 要 求 太 高 。 不 仅 要 求 所 有 参与 者 都 有 高 度 的 理性 ， 
不 允许 犯 任何 错误 ,而 且 要 求 所 有 参与 者 相互 了 解 和 信任 对 方 的 理性 在 很 多 阶段 中 ,对 理 
性 有 相同 的 理解 。 

让 我 们 通过 下 面 几 个 案例 来 更 好 地 理解 这 些 问题 。 

最 后 通 腾 博 弈 : 假设 有 1 万 元 钱 提供 给 甲乙 双方 ,分 配 规则 如 下 : 甲 提出 分 配 比 例 ， 
即 分 给 乙 5, 分 给 自己 1 一 s, 而 乙 则 可 以 选择 接受 或 者 不 接受 。 如 果 乙 接受 ,那么 按照 甲 
的 分 配 比 例 , 甲 可 以 得 到 1 一 s, 乙 可 以 得 到 s; 如 果 乙 不 接受 ,那么 甲乙 两 人 都 不 会 得 到 这 
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笔 钱 。 该 博弈 的 扩展 式 如 图 3-23 所 示 。 

在 理性 假设 下 ,用 逆向 归纳 法 分 析 , 不 难得 出 此 博 
弈 的 子 博弈 完美 均衡 : 参与 者 甲 自己 几乎 取 1, 而 乙 得 
任意 小 的 正 量 s( 取 极限 值 为 s=0)。 这 一 结果 如 此 简 
单 ,似乎 毋庸 置疑 。 但 是 ,用 逆向 归纳 法 得 出 的 这 个 结 
论 符 合 实际 吗 ? 很 遗憾 ,现实 并 非 如 此 。 实 验 表 明 : 

(1) 没有 发 生 过 ;二 0. 5 的 情况 。 

(2) 在 多 数 情况 下 ,有 s€ (0.4,0.5]。 

(3) s 过 0.2 的 情况 几乎 没有 出 现 。 (I=s,s) (0.0) 

(4) > 越 小 ,被 参与 者 2 拒绝 的 可 能 性 就 越 大 ,被 拒 图 3-23 最 后 通 骨 博弈 的 扩展 式 
绝 的 概率 随 ; 的 增加 而 递减 。 

实验 结果 为 什么 与 理论 预测 不 符 ? 原因 在 于 子 博弈 完美 纳什 均衡 对 参与 者 的 理性 要 
求 太 高 。 参 与 者 大 多 不 具备 "完全 理性 "的 行为 能 力 一 一 在 显 失 公平 时 将 不 再 追求 自身 利 
益 最 大 化 。 

电 蚊 博弈 ( 抢 钱 博弈 ) :“ 蛇 蛤 博弈 ?是 Rosenthal 提出 的 一 个 动态 博弈 问题 , 因 其 扩展 
式 像 一 条 昌 蛤 而 得 名 。 规 则 如 下 : 参与 者 1 和 参与 者 2 轮流 选择 进行 博弈 ,两 人 的 两 次 
决策 记 为 一 轮 。 在 第 站 轮 博弈 中 , 若 参 与 者 1 选择 D, 博 弈 结束 ,双方 的 得 益 都 是 1; 若 参 
与 者 2 选择 d, 博 弈 结束 ,双方 的 得 益 分 别 为 n 一 1 和 7 十 2。 若 该 博弈 进行 了 100 轮 还 未 
结束 , 则 博弈 强制 结束 ,双方 各 得 100。 该 博弈 的 扩展 式 如 图 3-24 所 示 。 


1 2 1 1 2 1 2 


R Tr R R r ®@ (100.100) 
d 


(11) (03) (22) (98.98) (97,100) (99.99) (98,101) 


图 3-24 蝇 蛤 博弈 的 扩展 式 


用 逆向 归纳 法 分 析 上 述 博弈 。 首 先 看 博弈 最 后 一 个 阶段 。 显 然 ,d 是 参与 者 2 的 最 
佳 选 择 ,意味 着 如 果 博 弈 进行 到 这 个 阶段 ,参与 者 1 和 参与 者 2 的 得 益 分 别 为 98 和 101 。 
再 逆 推 至 倒数 第 二 阶段 ,不 难看 出 参与 者 1 的 最 佳 选择 是 D。 再 逆 推 至 倒数 第 三 阶段 , 参 
与 者 2 的 选择 还 会 是 4。 以 此 类 推 , 我 们 可 以 得 到 该 博弈 的 结果 是 : 参与 者 1 在 第 一 阶段 
选择 D ,博弈 结束 ,双方 的 得 益 均 为 1 。 

子 博弈 完美 纳什 均衡 给 我 们 的 答案 是 : 参与 者 1 和 参与 者 2 都 只 为 眼前 的 蝇头 小 利 
抢先 结束 博弈 ,牺牲 了 获得 较 大 利益 的 机 会 。 但 即使 说 追求 收入 最 大 化 ,为 什么 不 能 眼光 
长 远 一 些 呢 ? 对 于 参与 者 1 来 说 ,目光 短 浅 地 为 钱 ,从 一 开始 就 抢 掉 那 1 元 钱 ,以 免 什么 
都 拿 不 到 ; 眼光 长 远 地 为 钱 , 先 不 拿 钱 , 顶 多 损失 1 元 , 却 有 可 能 换 来 100 元 钱 的 收入 。 
对 于 参与 者 2 来 说 ,目光 短 浅 地 为 钱 , 从 第 一 次 轮 到 他 决策 时 就 抢 掉 那 3 元 钱 ,以 免 只 能 
拿 到 2 元 钱 的 可 能 ; 眼光 长 远 地 为 钱 ,暂时 不 拿 钱 , 顶 多 少 拿 1 元 钱 ,同样 有 可 能 换 来 100 
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元 的 收入 。 

逆向 归纳 法 得 出 的 均衡 显然 没有 达到 帕 累 托 最 优 : 不 但 与 人 们 的 直觉 很 不 一 致 , 而 且 
也 与 实验 结果 相 了 矛盾 。 在 绝 大 多 数 随机 选择 的 参与 者 之 间 进 行 该 博弈 时 ,通常 都 不 会 出 
现 上 述 逆向 归纳 法 预测 的 结果 。 实 际 上 ,因为 这 个 博弈 将 怎样 进行 是 双方 都 清楚 的 事情 ， 
所 以 两 人 有 理由 稍稍 修正 原来 的 立场 ,进而 产生 合作 。 对 参与 者 1 来 说 ,在 第 一 节 阶 段 选 
择 R 而 不 选择 D 就 可 以 促成 双方 的 合作 。 如 果 参 与 者 2 理解 参与 者 1 的 第 一 阶段 选择 
中 包含 的 信号 ,那么 他 也 会 选择 合作 ,让 博弈 延续 到 下 一 阶段 而 不 是 结束 博弈 。 

但 是 ,这 种 合作 难以 持续 到 最 后 一 个 阶段 。 随 着 结束 阶段 的 临近 ,双方 进一步 合作 的 
潜在 利益 越 来 越 小 ,逆向 归纳 法 的 逻辑 肯定 会 在 某 个 时 刻 起 作用 ,并 且 这 个 时 刻 难以 预 
测 。 进 一 步 地 ,如 果 上 述 蝇 蛤 博弈 的 阶段 数 大 大 减少 ,如 只 有 3 个 或 5 个 阶段 ,那么 开始 
时 合作 的 可 能 性 就 要 小 得 多 ,因为 选择 合作 的 潜在 利益 减少 了 许多 ; 反之 ,如 果 昌 紧 博弈 
的 长 度 进一步 加 长 ,那么 合作 的 可 能 性 将 会 增加 ,平均 来 说 合作 的 阶段 数 也 会 大 大 增加 。 
在 后 续 章节 的 重复 博弈 中 , 随 着 参与 者 对 弈 次 数 的 变化 ,我 们 也 将 面临 与 此 相似 的 情况 。 

如 图 3-25 所 示 , 第 一 行 表示 接受 或 是 传递 的 行为 ,第 二 行 表示 参与 者 1 的 收益 ,第 三 
行 表 示 参 与 者 2 的 收益 ,最 后 一 行为 选择 接受 的 人 数 比 例 。 我 们 把 所 进行 的 实验 在 各 个 
阶段 终止 的 比例 在 图 中 进行 了 标注 ,发 现在 实际 验证 中 ,并 不 是 所 有 的 参与 者 都 选择 了 在 
第 一 阶段 终止 实验 。 


传递 传递 

接受 接受 

04 |02 |16 los [6.4 

01 [08 |04 [32 |1.6 

8% |41% |38% |10% |2% 

A B A B 
一 ~ ~ (640,160) 
J 
1 
(40.10) (20.80) (160.40) (80.320) 
8% 41% 38% 10% 


图 3-25 蝇 蛤 博弈 实验 (得 益 的 货币 单位 为 美 分 ) 


实验 发 现 , 常 常 的 情况 是 ,人 们 不 会 出 现 一 开始 选择 “不 合作 ”策略 而 双方 获得 最 低 收 
益 。 双 方 会 自动 选择 合作 性 策略 ,从 而 走向 合作 .但 是 这 种 合作 也 不 会 坚持 到 最 后 一 步 。 
理性 的 人 出 于 自身 利益 的 考虑 ,肯定 会 在 某 一 步 采 取 不 合作 策略 ,但 其 “终止 "合作 的 时 间 
和 动机 ,难以 确定 。 同 时 从 实验 来 看 ,人 们 合作 的 远见 常常 在 两 三 步 , 只 有 少数 人 具有 足 
够 的 远见 。 

通过 上 述 案例 ,相信 大 家 对 逆向 归纳 法 的 局 限 性 有 了 进一步 的 认识 。 但 是 ,北向 归纳 
法 为 什么 会 与 实际 不 符 呢 ? 实际 上 ,现实 生活 中 的 人 并 不 是 完全 “理性 "的 人 。 在 实际 博 
弈 问题 中 ,除了 “理性 "假设 之 外 ,往往 还 要 考虑 “公平 动机 “利他 偏好 ”等 因素 。 在 后 面 章 
节 ,我 们 将 会 对 这 些 问 题 做 进一步 的 讨论 。 
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二 ”游戏 与 实验 

假设 有 一 笔 财 富 进行 分 配 , 参 与 者 1 和 参与 者 2 在 轮 到 自己 行动 时 ,都 面临 “抢占 ”或 
“ 留 下 ”?。 如 果 抢 占 ,将 得 到 财富 的 4/5; 如 果 留 下 ,财富 将 翻 倍 。 博 弈 共有 三 轮 ,6 个 阶 
段 ,得 益 如 图 3-26 所 示 。 


1 2 1 2 人 


2 2 25.60 
留 下 | 留 下 | 留 下 | 留 下 


2 
留 下 | 留 下 6.40 


抢占 | 抢占 | 抢占 | 抢占 | 抢占 | 抢占 


0.40 0.20 1.60 0.80 6.40 3.20 
0.10 0.80 0.40 3.20 1.60 12.80 


图 3-26 抢 钱 博弈 得 益 


请 依照 图 3-26 的 博弈 组 织 实验 ,分 下 述 5 步 完 成 。 

(1) 设计 实验 ,包括 情景 描述 .是否 允许 沟通 、 参 与 人 数 等 细节 。 

(2) 制订 实施 计划 ,包括 实验 场地 、 被 试 者 选取 、 实 验 步骤 和 结果 记录 等 。 

(3) 课外 寻找 志愿 者 作为 被 试 人 员 参 与 实验 ,组 织 实施 。 

(4) 对 实验 结果 进行 统计 分 析 。 

(5) 在 情景 描述 时 , 若 告诉 志愿 者 这 是 一 笔 " 善 款 ” 而 非 “ 财 富 ”, 其 他 条 件 不 变 。 请 比 
较 两 种 结果 有 无 显著 差异 。 


LE 扩展 阅读 : 先 苦 后 甜 , 成 功 仍 需 深 谍 远 虐 


可 口 可 乐 公 司 非洲 集团 总 裁 兼 首席 运营 官 亚 历 山大 ， 卡 明 斯 (Alexander B. Cummings) 
曾 在 接受 访问 时 这 样 描 述 他 的 一 段 经 历 : 

当 你 并 非 整 个 企业 的 掌舵 人 ,而 只 是 其 中 的 一 位 领导 者 时 ,你 会 面临 来 自 上 级 和 下 属 
的 两 股 强大 的 压力 ,这 些 都 是 对 你 自身 能 力 的 考验 。 我 最 初 在 可 口 可 乐 公司 的 非洲 集团 
工作 时 ,曾经 做 了 一 项 自 认为 很 不 错 的 决定 ,但 不 幸 的 是 ,短期 结果 并 不 理想 。 事 实 上 ,我 
的 决策 导致 了 公司 销售 量 和 市 场 份额 的 下 降 。 直 到 今天 ,我 都 记得 当时 面临 的 巨大 压力 : 
改变 原来 的 决定 ,阻止 亏损 势头 。 

当时 的 情形 是 这 样 的 : 可 口 可 乐 公司 已 经 是 一 家 非常 具有 竞争 力 的 企业 (现在 依旧 
如 此 ), 提 高 销售 量 和 扩大 市 场 份 额 对 我 们 来 说 极为 重要 ,我 们 希望 看 到 产品 的 人 均 消费 
量 不 断 上 升 。 但 是 ,我 发 现 这 一 侧重 点 会 危及 我 们 的 整个 业务 系统 ,尤其 不 利于 我 们 的 装 
瓶 商 , 而 他 们 是 我 们 不 可 或 缺 的 合作 伙伴 。 

在 这 个 通货 膨胀 率 高 .货币 贬值 的 市 场 , 为 了 保持 我 们 的 增长 势头 ,我 们 已 经 连续 数 
年 维持 价格 不 变 。 结 果 , 我 们 的 装 瓶 商 竭 尽 全 力 , 也 只 能 勉强 支撑 。 出 于 对 整个 系统 利润 
率 的 考虑 ,我 力 排 众 议 ,做 出 了 提 价 的 决定 。 我 坚信 这 是 有 利于 公司 长 远 利益 的 一 项 正确 
决定 ,即使 提 价 的 主要 受益 者 是 装 壮 商 。 经 过 一 番 激 烈 的 争论 后 ,我 获准 继续 执行 这 项 具 
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有 争议 性 ,但 却 至 关 重 要 的 提 价 决定 。 

尽管 我 们 都 知道 这 项 决定 将 导致 销售 量 下 降 一 一 但 是 ,我 还 是 没有 预料 到 降幅 会 如 
此 之 大 。 更 令 人 不 安 的 是 ,尽管 我 们 的 竞争 对 手 在 几 周 之 内 就 跟随 我 们 提高 了 价格 ,我 们 
的 市 场 份额 还 是 出 现 了 下 滑 。 我 承受 的 压力 越 来 越 大 。 

我 拥有 丰富 的 管理 经 验 ,在 此 之 前 曾 在 一 家 公司 担任 首席 财务 官 ,负责 国际 业务 。 但 
说 句 老 实话, 在 我 的 职业 生涯 里 ,直到 那 一 刻 我 才 感 受到 前 所 未 有 的 压力 : 改变 原先 的 决 
定 ,将 价格 降 到 原来 的 水 平 。 我 有 点 儿 进 退 两 难 ,如 果 销 量 和 市 场 份额 继续 下 滑 , 我 的 职 
业 前 景 将 面临 很 大 的 风险 。 

尽管 面临 巨大 的 压力 ,但 我 坚信 就 中 长 期 而 言 , 我 的 这 项 决定 对 于 公司 和 装 瓶 商都 是 
正确 的 选择 。 我 们 只 是 需要 坚忍 不 拔 的 精神 来 克服 短期 的 困难 。 我 也 知道 ,如 果 我 收回 
成 命 , 我 对 装 翘 商 的 领导 力 和 威信 ,以 及 未 来 的 影响 力 都 将 大 打折 扣 。 最 后 ,我 决定 相信 
自己 的 直觉 ,我 坚信 ,公司 付 我 薪水 ,实际 上 就 是 要 我 做 出 这 样 的 决定 。 

幸运 的 是 ,我 做 的 一 切 最 终 获得 了 回报 。 在 歼 过 了 艰难 的 6 个 月 后 ,销量 和 市 场 份额 
最 终止 跌 回 升 。 到 了 第 四 季度 , 装 瓶 商 开始 看 到 提 价 为 其 带 来 的 财务 效益 。 我 们 的 经 济 
状况 最 终 也 得 到 了 改善 。 今 天 ,即使 我 们 在 非洲 市 场 还 面临 某 些 挑战 ,但 这 项 决定 仍 令 整 
个 业务 系统 受益 匪 浅 。 而 且 , 就 像 我 当初 低估 了 这 项 决定 在 短期 内 可 能 产生 的 负面 影响 
那样 ,我 也 没有 意识 到 我 们 与 装 瓶 商 的 关系 会 因此 得 到 如 此 大 的 改善 。 他 们 原 以 为 我 会 
尾 服 于 压力 。 但 是 ,我 坚持 了 自己 的 决定 ,我 们 与 装 瓶 商 的 关系 也 就 掀 开 了 新 的 篇 章 。 无 
论 是 从 经 济 还 是 从 心理 的 角度 来 看 ,我 们 之 间 的 关系 都 发 生 了 变化 。 我 们 可 口 可 乐 公司 
通过 此 举 向 装 瓶 商 表明 ,我 们 了 和解 他 们 面临 的 挑战 ,并 愿意 为 他 们 提供 支持 。 在 装 瓶 商 
(我 们 重要 的 业务 合作 伙伴 ) 眼 里 ,在 我 作为 一 个 领导 者 的 成 长 历程 中 ,成 功 落实 这 一 棘手 
的 决定 的 确 是 个 决定 性 的 时 刻 。 

一 摘自 (哈佛 商业 评论 》,2006 


3.5.3 颤抖 手 均衡 


上 一 小 节 曾 提 到 逆向 归纳 法 对 参与 者 的 理性 要 求 太 高 ,不 仅 要 求 所 有 参与 者 都 有 高 
度 的 理性 ,不 允许 犯 任何 错误 ,而且 要 求 所 有 参与 者 相互 了 解 和 信任 对 方 的 理性 。 那 么 ， 
对 于 理性 的 参与 者 来 说 ,如 果 其 他 参与 者 犯错 误 ,偏离 了 子 博弈 完美 纳什 均衡 路 径 时 ,应 
该 怎样 进行 后 面 的 博弈 呢 ? 

现 以 图 3-27 所 示 的 三 阶段 动态 博弈 来 阐述 这 个 问题 。 

用 逆向 归纳 法 可 以 找 出 该 博弈 的 子 博弈 完美 纳什 均衡 是 : 参与 者 1 在 第 一 阶段 选择 
U, 在 第 三 阶段 选择 D'; 参与 者 2 在 第 二 阶段 选择 R。 博 弈 结果 是 : 参与 者 1 在 第 一 阶段 
选择 U ,博弈 结束 ,双方 的 得 益 分 别 为 2 和 0。 如 果 两 个 参与 者 是 完全 理性 的 ,上 述 均衡 
和 结果 没有 任何 疑问 。 但 是 ,如 果 参 与 者 1 在 第 一 阶段 的 行动 选择 中 犯错 误 地 选择 了 D， 
假如 参与 者 2 是 理性 的 ,他 该 怎样 进行 选择 呢 ? 

如 果 按 照 子 博弈 完美 纳什 均衡 的 策略 ,参与 者 2 应 该 选择 R。 因 为 理性 的 参与 者 1 
在 第 三 阶段 会 选择 D' ,这 样 参与 者 2 的 得 益 就 是 3 , 比 第 二 阶段 直接 选择 L 的 得 益 多 。 但 
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(0.1) (13) 
图 3-27 对 参与 者 理性 程度 要 求 过 高 的 子 博弈 完美 纳什 均衡 


是 ,在 参与 者 1 第 一 阶段 选择 D 而 不 是 U 的 情况 下 ,参与 者 2 还 能 相信 参与 者 1 的 理 
性 吗 ? 

这 时 参与 者 2 需要 考虑 的 问题 是 : 参与 者 1 在 第 一 阶段 所 犯 的 错误 只 是 一 个 不 影响 
后 续 阶 段 理性 判断 的 偶然 失误 ,还 是 其 理性 层次 非常 低 , 接 下 来 还 会 继续 犯错 误 ? 抑或 是 
参与 者 1 故意 犯错 误 ? 显然 ,对 参与 者 1 犯错 误 行动 的 理解 不 同 , 将 直接 影响 到 后 续 博 穿 
的 进行 。 

在 遇 到 参与 者 犯错 误 的 情况 下 ,应 该 怎样 理解 这 种 错误 ,又 该 如 何 预测 博弈 的 走向 
呢 ? 这 里 我 们 介绍 一 种 理解 有 限 理性 的 参与 者 在 动态 博弈 中 偏离 子 博弈 完美 纳什 均 衔 行 


动 的 重要 思想 一 “ 颜 拌 手 均衡 ”。 参与 者 2 
为 了 便于 理解 ,首先 我 们 用 得 益 矩 阵 形 式 表示 L R 
的 静态 博弈 介绍 颤 拌 手 均衡 的 思想 ,如 图 3-28 所 示 。 参与 者 | U -00 2 
在 图 3-28 所 示 的 博弈 中 ,有 两 个 纳什 均衡 ,分 别 下 Il ， 
是 (D,L) 和 (U,R)。 其 中 ,(D,L) 对 参与 者 1 较为 有 图 3-28 博弈 (一 ) 


利 ,(U,R) 对 参与 者 2 较为 有 利 。 如 果 不 考虑 参与 
者 的 选择 和 行动 偏差 ,这 两 个 纳什 均衡 都 具有 稳定 性 ,都 可 能 是 该 博弈 的 结果 。 但 如 果 考 
虑 到 参与 者 的 选择 和 行动 可 能 出 现 偏差 ,情况 还 会 相同 吗 ? 

对 参与 者 1 来 说 ,如 果 参 与 者 2 有 可 能 选择 R, 无 论 这 种 可 能 性 多 么 小 ,他 的 最 佳 选 
择 都 是 U 而 不 是 D。 而 参与 者 2 考虑 到 参与 者 1 的 这 种 思路 ,就 会 选择 R 而 不 是 L。 因 
此 ,(D,L) 就 不 再 具有 稳定 性 。 

再 来 看 均衡 (U,R) 。 对 参与 者 1 来 说 ,不 管 参 与 者 2 是 否 有 偏离 R 的 可 能 ,他 都 没 
有 必要 偏离 U。 对 参与 者 2 来 说 ,虽然 参与 者 1 从 U 偏离 到 D 对 他 有 不 利 影响 ,但 只 要 
参与 者 1 偏离 的 可 能 性 (概率 ) 不 超过 2/3 ,就 没有 必要 改变 自己 的 策略 。 因 此 ,(U,R) 对 


i 于 概率 较 小 的 偶然 偏差 来 说 具有 稳定 性 ,具有 这 样 
L R__ 性质 的 策略 组 合 称 为 “ 闫 拉手 均衡 "。(D,L) 便 不 是 

em 62 “| 颜 拌 手 均衡 。 
DL | 20 如 果 我 们 把 参与 者 1 的 得 益 稍 作 改变 ,情况 又 


图 3-29 博弈 (二 ) 会 有 所 不 同 , 如 图 3-29 所 示 。 
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在 这 个 博弈 中 ,(D,L) 也 是 闸 抖 手 均衡 。 为 什么 呢 ? 对 参与 者 1 来 说 ,参与 者 2 偏离 
L 而 选择 R 的 确 会 对 自己 造成 不 利 影响 ,但 只 要 参与 者 2 偏离 的 可 能 性 不 超过 1/5, 那 么 
自己 坚持 选择 D 就 是 最 佳 策略 。 

对 参与 者 2 来 说 ,只 要 参与 者 1 偏离 DD 的 可 能 性 不 超过 1/3, 自 己 也 没有 必要 改变 策 
略 。 因 此 ,(D,L) 对 于 概率 不 太 大 的 偶然 偏差 来 说 同样 具有 稳定 性 。 


分 思考 与 练习 
你 知道 上 述 这 些 偏 离 可 能 性 是 如 何 计算 出 来 的 吗 ? 


通过 上 述 两 个 例子 的 对 比 ,我 们 可 以 发 现 : 一 个 纳什 均衡 要 是 一 个 颤 拌 手 均衡 ,一 
定 不 能 包含 任何 * 弱 劣 策略 ”, 也 就 是 偏离 对 偏离 者 没有 损失 的 策略 。 包 含 弱 劣 策略 的 
纳什 均衡 不 可 能 是 颤 拌 手 均衡 ,因为 只 要 有 一 丝 犯 错误 的 可 能 ,它们 就 不 再 具有 稳 
定性 。 

现在 我 们 讨论 用 扩展 型 表示 的 动态 博弈 的 颜 拌 手 均衡 ,如 图 3-30 所 示 。 


(0.0) (2.3) 
图 3-30 扩展 型 动态 博弈 的 颤抖 手 均衡 


用 逆向 归纳 法 进行 分 析 , 可 以 发 现 该 博弈 有 两 条 子 博弈 完美 纳什 均衡 路 径 。 其 一 
是 参与 者 1 在 第 一 阶段 选择 二 ,博弈 结束 ; 其 二 是 RN-T-V。 但 是 第 二 条 不 是 闸 抖 手 
均衡 路 径 ,因为 只 要 参与 者 1 考虑 到 参与 者 2 在 后 续 阶 段 有 偏离 子 博 弈 完美 均衡 路 径 
的 可 能 性 ,第 一 阶段 就 不 会 选择 R。 因 此 第 二 条 路 径 对 应 的 子 博弈 完美 纳什 均衡 是 不 
稳定 的 。 

用 扩展 型 表示 的 博弈 允许 参与 者 在 实际 选择 行动 中 犯错 误 。 如 果 参 与 者 在 每 个 信息 
集 上 犯错 误 的 概率 是 独立 的 (因而 局 中 人 不 会 犯 系统 性 的 错误 ,今后 也 不 会 常 犯错 误 ), 则 
无 论 过 去 的 行动 怎样 ,参与 者 在 今后 应 继续 使 用 逆向 归纳 法 预测 从 现在 开始 的 子 博弈 的 
行动 (既往 不 答 )。 

回 到 图 3-30 所 示 的 动态 博 穿 问 题 。 按 照 颤 拌 手 均 衡 的 思想 ,不 难看 出 ,该 博 窃 有 了 唯 
一 的 子 博 弈 完美 纳什 均衡 ,同时 也 是 唯一 的 颤抖 手 均衡 , 即 参与 者 1 第 一 阶段 选择 L, 博 
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弈 结束 。 如 果 在 实际 进行 这 个 博弈 时 ,参与 者 1 在 第 一 阶段 选择 了 R 而 不 是 工 ,那么 参与 
者 2 在 第 二 阶段 还 是 会 选择 N 而 不 是 M。 因 为 在 从 第 二 阶段 参与 者 的 选择 开始 的 子 博 
弈 中 ,NTT-V 既是 子 博弈 完美 纳什 均衡 路 径 , 也 是 颤 拌 手 均衡 路 径 。 
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~, 

生活 中 常 有 这 样 的 情形 : 参与 纸牌 游戏 的 玩家 可 能 记 不 清 对 方 是 否 走 过 某 一 步 , 博 
彩 者 常常 不 知道 其 他 人 手中 的 底牌 ,商品 交易 中 买 家 不 知道 卖家 是 否 做 过 “手脚 "…… 实 
际 上 ,在 相当 多 的 博弈 情景 中 ,部 分 (或 全 部 ) 参 与 者 并 不 清楚 别人 曾 如 何 行动 ,因此 博弈 
将 变 得 复杂 起 来 。 结 构 完备 但 过 程 不 完美 的 博弈 被 称 作 完全 但 不 完美 信息 博弈 , 它 比 完 
全 且 完 美 信息 博弈 更 为 常见 ,而 在 非 标准 化 的 商业 交易 中 尤为 明显 。 

在 Airbnb 掀起 房屋 共享 浪潮 之 前 ,即使 房东 * 有 图 有 真相 ”、 租 客 "“ 有 证 有 背书 ”, 仅 凭 
在 线 沟通 很 难 达成 一 段 为 期 数 天 的 旅行 短 租 。 尽 管 房 源 照片 和 信息 可 供 租 客 网 上 浏览 ， 
但 实际 状况 是 否 和 图 片 一 致 , 租 客 不 得 而 知 。 同 样 ,尽管 租 客 到 达 后 会 出 示 身 份 证 件 , 但 
能 否 保 持 屋 内 的 整洁 干净 ,房东 也 不 得 而 知 。 租 客 不 知 房 源 信息 是 否 真 实 , 房 东 不 知 租 客 
品 性 好 坏 ,那么 双方 合作 是 否 愉快 尚未 可 知 。 房 源 真 实 租 客 规矩 ,说 不 定 交 个 朋友 ; 房 源 
不 实 租 客 吐 允 , 弄 不 好 大 打出 手 …… 这 样 潜 在 的 不 愉快 没 人 愿意 遇 到 ,担心 房 源 不 够 理想 
的 租 客 选择 住 酒店 ,提防 房子 受到 损害 的 房东 也 不 愿 出 租 。 劣 币 驱 逐 良 币 , 短 租 市 场 供需 
难 配 。 那 么 ,Airbnb 的 策略 触动 了 哪些 根本 因素 呢 ? 

更 为 普遍 的 例子 是 ,卖家 可 能 通过 一 定 的 手段 掩盖 商品 所 存在 的 问题 ,使 得 买 家 在 不 
能 认 清 商品 真实 价值 的 情况 下 遭受 欺骗 。 在 美国 但 语 中 ,这 样 的 情况 就 是 买 到 了 “ 柠 榜 ” 
(代表 次 品 )。 那 么 ,买卖 双方 应 该 如 何 行动 才能 最 大 化 收益 ?在读 完 这 一 章 后 ,希望 你 能 
够 找到 自己 的 答案 。 


此 前 各 章 所 介绍 的 博弈 模型 都 是 完全 且 完 美 信息 的 。 在 这 些 博弈 中 参与 者 具有 共同 
知识 ,双方 对 于 博弈 所 了 解 的 信息 是 充分 且 对 称 的 。 但 在 现实 决策 中 ,参与 者 所 能 获取 的 
信息 并 不 总 是 充分 和 对 称 的 。 辟 如 ,企业 难以 深入 了 解 员工 的 业务 素质 和 努力 程度 、 家 电 
买 家 缺乏 对 商品 质量 的 足够 了 解 .拍卖 中 的 出 价 一 方 无 法 确 知 其 他 出 价 者 对 商品 的 真实 
估价 ,专家 提供 的 建议 是 否 可 信 等 。 

请 回顾 第 1 章 内 容 , 可 依据 信息 是 否 完全 和 是 否 完美 对 博弈 进行 分 类 : 参与 者 完全 
知晓 所 有 参与 者 在 各 种 情况 下 的 策略 和 得 益 即 为 信息 完全 ,而 所 有 参与 者 对 博弈 的 进程 
(历史 ) 信 息 完 全 知晓 即 为 信息 完美 。 在 一 个 完全 且 完 美 信息 博弈 中 ,逆向 归纳 法 可 剔除 
不 可 信 威 胁 。 但 是 在 不 完美 信息 博弈 中 ,问题 就 不 那么 简单 了 一 一 因为 在 这 种 博弈 中 某 
个 (或 多 个 ) 参 与 者 不 知 自己 身 在 何 处 ,进而 无 法 像 第 3 章 中 的 情形 一 样 使 用 逆向 归纳 法 
做 出 理性 预测 。 这 点 将 在 以 后 的 小 节 中 详细 讲解 。 
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进一步 , 当 某 一 参与 者 受 条 件 限 制 无 法 知晓 他 人 所 拥有 的 信息 时 ,就 形成 了 信息 不 对 
称 。 掌握 信息 充分 的 参与 者 往往 处 于 有 利 地 位 ,而 信息 贫乏 者 则 处 于 不 利 地 位 。 换 言 之 ， 
占有 信息 多 的 一 方 存在 不 当 获 利 的 机 会 , 即 凭借 自己 所 占有 信息 的 优势 来 误导 、 欺 骗 男 一 
方 , 使 自己 获 利 而 使 他 人 受 损 。 这 种 信息 不 对 称 的 现象 在 现实 生活 中 大 量 存在 ,并 造成 大 
量 不 该 有 的 经 济 后 果 一 一 效率 损失 。 而 信息 经 济 学 的 主要 内 容 则 是 研究 如 何 设计 机 制 来 
克服 这 种 效率 损失 。 

可 想 而 知 ,实际 问题 远 比 前 几 章 所 遇见 的 模型 要 复杂 ,因而 对 不 充分 (包括 不 完全 和 
不 完美 ) 的 研究 是 博弈 论 在 现实 中 广泛 应 用 的 前 提 。 稍 后 你 将 会 看 到 ,信息 的 不 充分 性 会 
增加 决策 的 难度 ,从 而 影响 博弈 的 结果 和 效率 。 当 然 ,与 此 相关 的 理论 分 析 也 完全 且 完 美 
信息 下 的 分 析 更 难 更 复杂 。 从 博弈 论 发 展 史 来 看 ,有 些 理论 逐渐 成 为 研究 信息 价值 的 常 
规 方法 ,有 些 则 慢 慢 淡出 。 

本 章 将 首先 介绍 信息 是 否 充 分 ,接着 讲述 完美 贝 叶 斯 均衡 的 概念 和 分 析 方 法 ,进而 通 
过 案例 加 以 巩固 ,最 后 是 关于 信息 不 对 称 的 讨论 ,用 于 衔接 第 5 章 不 完全 信息 博弈 。 


4.1 基本 概念 


4.1.1 何谓 信息 不 完美 


人 人 都 抱怨 自己 的 记忆 力 , 却 不 曾 听 到 有 人 抱怨 自己 的 判断 力 。 
-一 拉 罗 什 弗 科 

上 文 简单 回顾 了 何谓 信息 不 完美 ,本 小 节 将 继续 深入 描述 。 

在 动态 博弈 中 ,各 个 参与 者 的 行动 是 存在 先后 次 序 的 。 如 果 一 个 参与 者 在 做 出 行动 
时 掌握 了 该 时 刻 之 前 所 有 的 博弈 进程 (所 有 参与 者 行动 的 历史 信息 ), 则 该 参与 者 被 称 作 
“拥有 完美 信息 的 参与 者 ”, 或 称 “是 信息 完美 的 "。 相 反 ,如果 一 个 参与 者 无 法 掌握 所 有 的 
进程 信息 , 则 他 被 称 作 ”拥有 不 完美 信息 的 参与 者 ”"。 进 一 步 ,如 果 所 有 参与 者 都 是 “拥有 
完美 信息 的 参与 者 ”, 则 该 博弈 为 “完美 信息 动态 博弈 "。 反 之 , 则 是 “不 完美 信息 动态 博 
弈 ?。 例 如 ,第 3 章 所 提 到 的 “讨价还价 ?是 完美 信息 动态 博弈 ,而 第 1 章 中 的 “ 猜 硬币 ” 则 
是 不 完美 信息 博弈 。 

定义 4.1 如 果 存 在 某 一 个 ( 些 ) 参 与 者 在 需要 做 出 决策 时 无 法 完全 知晓 此 前 的 博弈 
历史 ,这 类 博弈 被 称 作 不 完美 信息 博弈 。 

注意 ,只 要 存在 任意 一 方 不 具有 完美 信息 ,该 博弈 就 是 不 完美 信息 博弈 。 另 外 ,由 于 
这 层 “ 信 息 不 完美 "约束 ,要 求 参与 者 的 行动 存在 先后 次 序 。 这 点 不 同 于 完全 且 完 美 信息 
下 的 静态 和 动态 两 种 分 类 。 因 此 ,我 们 主要 讨论 “不 完美 信息 动态 博弈 ”, 简称 为 “不 完美 
信息 博弈 ”。 

让 我 们 回顾 * 猜 硬币 ”博弈 。 此 博弈 中 有 两 个 参与 者 : 盖 硬 币 方 和 猜 硬币 方 。 尽 管 我 
们 曾 将 “ 猜 硬 币 ” 博 弈 视 作 静态 博弈 。 但 严格 来 讲 , 各 参与 者 的 行动 是 有 先后 的 。 接 下 来 
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依照 动态 博弈 来 考察 。 盖 硬币 方 先 行动 ,在 做 出 “正面 向 上 ?或 “反面 向 上 ?的 行动 后 ,由 对 
方 来 猜 。 由 于 无 法 知晓 盖 硬 币 方 的 决定 ,因此 猜 硬 币 方 的 判断 只 能 靠 " 猜 ?! 仍 沿用 扩展 
型 来 表示 该 博弈 。 但 是 提请 注意 ,这 是 不 完美 信息 博弈 ,扩展 型 是 否 适 用 仍 存疑 。 暂 且 画 
出 扩展 型 试 试 ,如 图 4-1 所 示 。 


盖 硬 币 方 


猜 硬币 方 《 


(1,D) (71) (7-D) (C11) 
图 4-1 猜 硬 币 博弈 扩展 型 


在 图 4-1 的 扩展 型 描述 中 ,最 上 方 的 第 1 层 节点 代表 猪 硬币 方 , 他 有 * 正 六 反 ” 两 种 和 
择 。 第 2 层 的 两 个 节点 都 代表 猿 硬币 方 。 盖 硬币 方 盖 定 * 正 ?或 " 反 " 后 , 轮 到 猜 硬币 方 来 
猜 。 由 于 后 者 不 知 前 者 行动 ,因此 他 不 清楚 自己 处 于 图 4-1 中 的 哪个 节点 。 换 句 话 讲 , 猫 
硬币 方 不 能 区 分 左右 这 两 个 节点 一 一 它们 具有 相同 的 历史 信息 。 在 信息 经 济 学 中 , 称 这 
两 个 节点 具有 相同 的 “信息 集 ”, 因 此 ,将 它们 用 椭圆 图 起 来 。 所 谓 信息 集 ,是 指 轮 到 某 个 
参与 者 行动 时 所 具有 的 历史 信息 。 在 完美 信息 博弈 中 它 的 意义 非常 明确 ,由 于 从 一 
点 上 淹 至 起 点 的 路 径 是 唯一 的 ,因此 该 点 所 对 应 的 信息 集 只 须 用 这 个 节 
点 来 表示 。 然 而 ,图 4-1 中 猜 硬币 方 的 信息 集 却 包含 了 两 个 节点 ,我 们 
把 这 种 包含 了 两 个 或 两 个 以 上 节点 的 信息 集 称 作 * 多 节点 信息 集 *。 在 “号 站 “ 
多 节点 信息 集中 ,由 于 包含 了 多 种 状态 ,因此 参与 者 无 法 明确 地 知道 和 熙 左 
己 究 竞 处 于 哪个 节点 ,也 就 无 法 进行 针对 性 的 选择 。 


WW 进 阶 阅读 :“ 信 息 集 " 是 什么 


一 般 而 言 , 信 息 集 是 指 参 与 者 尽 其 所 察 而 形成 的 所 有 已 发 生 行动 的 集合 。 在 博弈 的 
扩展 型 表示 中 ,信息 集 是 指 参 与 者 无 法 区 分 的 决策 节点 的 集合 。 如 果 博 弈 是 完美 信息 的 ， 
一 个 信息 集 对 应 一 个 节点 , 则 每 个 信息 集 内 只 有 一 个 参与 者 ,并 显示 博弈 所 处 的 阶段 。 反 
之 ,在 不 完美 信息 下 一 个 信息 集 却 可 能 包含 多 个 节点 。 在 多 节点 信息 集中 ,参与 者 不 能 完 
美 记忆 自己 究竟 处 于 哪个 节点 上 ,也 就 无 法 准确 地 知道 曾经 发 生 的 事 和 当前 的 情势 。 

例如 ,在 一 个 不 完美 的 信息 集中 : 

(1) 每 个 节点 只 描述 一 个 参与 者 。 

(2) 参与 者 无 法 区 分 信息 集 里 的 多 个 节点 , 意 即 参与 者 无 法 确定 自己 是 沿 着 一 条 路 
径 走 到 了 A 点 ,还 是 沿 着 另 一 条 路 径 走 到 了 BB 点。 


4.1.2 不 完美 信息 博弈 的 表示 
上 一 小 节 通 过 ”* 猜 硬币 "博弈 介绍 了 不 完美 信息 博弈 的 基本 概念 。 既 然 参 与 者 不 知道 


视频 
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应 该 往 哪 个 节点 移动 ,那么 逆向 归纳 方法 是 否 适 用 值得 存疑 。 欲 使 用 逆向 归纳 法 ,必须 在 
建 模 时 做 一 些 数学 处 理 。 因 此 ,这 一 小 节 将 介绍 不 完美 信息 博弈 的 表示 。 

请 读者 试 着 理解 这 样 一 个 二 手 车 交易 市 场 。 市 场 内 存在 两 类 决策 主体 : 二 手 车 的 卖 
家 和 买 家 。 不 妨 设 卖 家 是 一 个 拥有 待 售 二 手 车 的 车 商 , 并 且 对 于 车 的 状况 十 分 清楚 。 二 
手 车 既 有 好 车 也 有 差 车。 任意 考察 一 辆 汽车 , 它 是 好 车 或 差 车 的 可 能 性 是 既定 的 ,并 不 受 
买卖 双方 行动 的 影响 。 或 者 说 , 任 一 辆 汽车 状况 的 好 坏 并 非 人 为 决定 的 。 因 此 ,不 妨 引 入 
一 个 虚拟 局 中 人 “自然 ”, 并 假设 这 一 概率 由 “自然 ”所 决定 。( 此 处 的 “自然 "实际 上 大 有 学 
问 ,我 们 将 在 下 文 详细 介绍 ,现在 读者 不 妨 就 把 “自然 ” 当 作 能 够 决定 某 些 概 率 的 普通 局 
中 人 。) 

差 车 进入 市 场 销售 前 必须 维修 装扮 ,假设 装扮 费用 为 1 万 元 。.? 一 般 来 讲 , 买 家 不 具 
备 鉴 别 车 辆 状况 的 专业 能 力 或 信息 ,只 能 依赖 于 车 辆 的 外 观 做 出 判断 。 假 设 差 车 经 装扮 
后 与 好 车 无 异 ,能 够 在 市 场 上 以 2 万 元 的 价格 售 出 。 卖 家 从 出 售 差 车 中 获得 1 万 元 的 利 
润 ,从 出 售 好 车 中 获 利 2 万 元 。 但 是 , 若 差 车 无 法 售 出 则 卖家 损失 1 万 元 。 由 于 好 车 并 无 
装扮 ,因此 卖家 的 损失 计 为 0 元 。 买 家 若 买 到 好 车 , 则 得 到 1 万 元 当量 的 消费 价值 ; 若 买 
到 差 车 , 则 损失 2 万 元 。 

首先 ,车 商 决定 是 否 售 出 车 辆 ; 其 次 , 买 家 决定 是 否 买 人 。 这 是 双方 的 行动 。 至 此 ， 
参与 者 、 得 益 、 可 能 行动 以 及 行动 的 次 序 都 很 清楚 了 ,读者 不 妨 尝试 自己 建立 模型 。 

在 建 模 过 程 中 你 也 许 发 现 , 它 不 同 于 第 3 章 的 扩展 型 博弈 ,因为 好 车 和 差 车 将 对 应 不 
同 的 得 益 组 合 。 实 际 上 , 买 家 是 看 不 到 车 辆 状况 的 ,但 是 卖家 能 看 到 。 因 此 ,车 辆 的 好 坏 
对 买 家 来 讲 是 一 个 随机 事件 。 如 前 所 述 ,将 之 视 为 "自然 "决定 的 。 那么 ,考虑 "自然 ”后 ， 
博 穿 的 行动 次 序 如 何 呢 ? 

第 一 步 : “自然 "选择 车 况 (好 或 差 )。 

第 二 步 : 车 商 决定 是 否 在 二 手 市 场 上 卖 车 。 

第 三 步 : 车 车 商 选 择 不 卖 ,博弈 结束 ; @ 若 车 商 选 择 卖 车 , 买 家 选择 买 或 不 买 ; 
加 博弈 结束 。 

不 同行 动 所 对 应 的 结果 分 别 如 下 。 

(1) 若 车 商 选择 不 卖 车 ,市场 上 没有 发 生 交易 ,双方 得 益 为 (0.0)。 上 述 括号 中 第 1 
个 0 表示 先行 动 者 即 车 商 的 得 益 ,第 二 个 0 表示 后 行动 者 即 买 家 的 得 益 , 下 同 。 

(2) 若 车 商 在 车 况 好 时 决定 卖 车 ,而 买 家 买 下 ,市 场 交易 是 双赢 的 ,双方 得 益 为 
(2,1)。 

(3) 若 车 商 在 车 况 好 时 决定 卖 车 ,而 买 家 不 买 ,得 益 为 (0,0)。 

(4) 若 车 商 在 车 况 差 时 决定 卖 车 ,而 买 家 买 下 ,得 益 为 (1, 一 1)。 

(5) 若 车 商 在 车 况 差 时 决定 卖 车 ,而 买 家 不 买 .得 益 为 (一 1,0) 。 

根据 上 述 描述 ,不 难得 到 该 博弈 的 扩展 型 ,如 图 4-2 所 示 。 


@ 本 书 没有 考虑 车 辆 的 购 入 成 本 。 


第 4 章 完全 但 不 完美 信息 博弈 131 


天 不 买 。 买 不 习 
(2.1) (0.0) (1.-2) (一 1.0) 


图 4-2 简单 的 二 手 车 交易 模型 


2 扩展 阅读 : 为 何 由 “自然 "来 决定 概率 


相信 读者 对 上 文 开启 上 帝 视角 的 “自然 "充满 了 疑惑 ,为 了 帮助 读者 理解 “自然 "这 一 
概念 ,我 们 将 介绍 心理 学 家 斯 金 纳 的 一 个 经 典 实验 。 

实验 方法 : 将 一 只 很 饭 的 小 白鼠 放 入 一 个 有 按钮 的 箱 中 , 设 定 其 获得 奖励 是 带 有 随 
机 性 的 , 即 小 白鼠 按 按钮 的 情况 下 ,有 一 定 概率 会 获得 食物 。 

实验 结果 : 小 白鼠 不 停 地 按钮 。 当 不 再 掉 落 食物 时 ,小 白鼠 的 反应 耐人寻味 : 出 现 
了 作 担 反复 跳 跃 等 行为 。 它 们 发 展 出 一 套 行 为 模式 ,以 期 望 引发 掉 落 食物 。 然 而 ,食物 
的 掉 落 其 实 完 全 是 由 外 部 环境 的 设 定 而 随机 出 现 的 。 

就 像 赌 徒 在 翻 硬币 前 总 会 祈祷 ,实验 中 “ 花 式 求 食 ” 的 小 白鼠 也 项 图 用 自身 的 “努力 社 
告 ”增进 得 益 。 但 赌 徒 的 祈祷 不 会 改变 硬币 的 正 反 ,小 白鼠 的 祷告 也 不 会 影响 投 食 的 多 
少 。 在 诸如 二 手 车 市 场 等 不 完美 信息 博弈 中 ,参与 者 对 车 辆 的 装扮 .拣选 等 行为 看 似 左 右 
着 车 况 , 实 际 上 并 未 对 其 发 生 概 率 造 成 显著 影响 。 决 定 这 些 的 ,是 上 帝 一 般 的 “自然 ”。 
“自然 ”如 同 看 不 见 的 手 一 般 , 是 设 定好 的 外 部 环境 ,完全 地 置身 于 博弈 之 外 。 它 不 受 参 与 
者 行为 的 影响 ,随机 决定 着 “ 正 或 反 ”“ 有 或 无 ”好 或 坏 ” 的 概率 。 接 下 来 的 章节 里 ,我 们 将 
经 常 引 入 “自然 ”作为 参与 者 赋予 博弈 外 部 设 定 的 概率 。 


让 我 们 尝试 操作 ,来 看 电影 (教父 ) 中 的 一 个 情节 。 
案例 分 析 : 迈克 尔 * 一 夫 当 关 ” 


美国 本 部 黑手 党 领袖 教父 维 托 " 柯 里 昂 (Vito Corleone) 雷厉风行 ,德高望重 ,尽管 
是 黑道 领袖 却 坚 守 准 则 决 不 贩毒 害 人 。 为 此 他 拒绝 了 毒 奥 素 洛 佐 (Sollozo) 的 联盟 要 求 ， 
使 两 家 结 做 。 圣 诞 前 夕 , 教 父 维 托 遭 到 仇家 素 洛 估 的 暗算 ,中 枪 后 侥幸 活命 , 送 医 抢 救 。 
维 托 的 小 儿子 迈克 尔 去 医院 探望 父亲 , 却 发 现 守卫 已 被 收买 ,自己 与 重伤 的 父亲 孤立 无 


深夜 ,迈克 尔 察觉 医院 楼 下 出 现 异 动 。 他 猜测 是 仇家 素 洛 估 的 手下 企图 乘虚 而 入 , 悄 
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然 加 害 父 亲 。 本 是 探 病 的 迈克 尔 并 没有 带 枪 ,但 为 了 保护 父亲 ,他 急中生智 ,伙同 一 位 临 
时 探望 者 守 在 医院 门口 ,同时 将 手 放 在 外 衣 口 袋 里 伴 装 有 枪 。 为 了 不 暴露 身份 ,杀手 只 身 
前 来 。 杀 手 本 以 为 医院 守卫 全 被 收买 ,一 路 畅行 无 阻 , 却 没 想 到 门口 有 迈克 尔 守卫 。 杀 手 无 
法 判断 他 们 到 底 有 没有 枪 ,更 重要 的 是 无 法 确定 他 身后 是 否 有 埋伏 。 如 果 迈 克 尔 没有 枪 , 杀 
手 可 以 干净 利落 地 杀 掉 他 并 成 功 完 成 刺杀 教父 的 任务 。 但 如 果 迈 克 尔 有 枪 , 杀 手 开 枪 会 引 
发 枪战 ,不 仅 自 身 势 单 ,而 且 还 会 导致 素 洛 俱 刺杀 教父 的 行径 昭 于 天 下 。 经 过 短暂 的 对 峙 ， 
杀手 放弃 贸然 行动 ,只 得 悄然 离开 。 迈 克 尔 镇 定 自若 的 伪装 成 功 守 护 了 父亲 和 家 族 的 荣誉 。 


这 是 一 个 博弈 , 它 有 两 个 参与 者 : 迈克 尔 和 杀手 。 迈 克 尔 先行 动 ,接着 杀手 行动 。 试 
想 一 下 ,在 迈克 尔 发 现 医 院 无 人 守卫 时 ,他 有 多 种 可 能 的 选择 : 演 空 城 计 , 躲 人 密室 ,报告 
医院 ,大 声 呼 救 , 等 等 。 在 他 迅速 做 出 权衡 之 后 选择 了 上 演 空城 计 。 不 妨 假设 迈克 尔 在 剔 
除 严格 下 策 后 还 剩 下 "* 演 空城 计 ” 和 "* 租 和 密室 ?两 种 可 能 行动 。 请 注意 ，“ 演 空城 计 意 味 
着 必须 考虑 真 假 两 种 信息 : 持 枪 戒 备 , 还 是 赤 手 空 拳 。 尽 管 这 两 种 信息 对 迈克 尔 来 讲 不 
言 自明 ,但 是 杀手 并 不 清楚 。 如 果 信 息 透 明 , 那 么 持 枪 或 不 持 枪 时 不 同行 动 所 对 应 的 后 果 
对 双方 来 讲 都 是 共同 知识 ?。 问 题 就 在 于 信息 不 透明 : 杀手 不 知道 迈克 尔 是 否 带 枪 。 对 


文 的 做 法 ,假设 在 二 人 行动 前 “自然 "已 经 决定 了 迈克 尔 是 否 带 枪 ,那么 这 个 博弈 可 视 为 信 
息 完 全 但 不 完美 。 

既然 这 是 不 完美 信息 博弈 ,将 “是 否 持 枪 ” 视 作 “ 自 然 选择 ”, 那 么 迈克 尔 的 可 能 行动 可 
重 述 为 : “门口 把 守 ? 或 者 “ 暗 处 躲避 ”。 而 杀手 必须 决定 是 “执行 刺杀 行动 , 杀 掉 迈克 尔 和 
维 托 ”( 刺 杀 ) 或 “放弃 刺杀 行动 ,离开 医院 "(离开 )。 对 于 杀手 而 言 ,他 并 不 能 确定 迈克 尔 
是 否 持 枪 。 进 一 步 ,“ 迈 克 尔 持 枪 把 守 ” 和 “迈克 尔 空手 把 守 ” 这 两 种 行动 于 他 而 言 并 无 二 
致 ,迈克 尔 持 枪 躲 避 ” 和 ”迈克 尔 空 手 躲 避 ” 也 一 样 2。 我 们 用 图 4-3 表示 该 博弈 ,并 为 每 


种 结果 设 定 了 具体 得 益 。 
(1) 无 论 迈 克 尔 持 枪 还 是 空手 .把守 还 是 躲避 ,只 要 杀手 离开 ,我 们 都 认为 双方 得 益 
均 为 0。 


(2) 当 迈 克 尔 空手 把 守 时 , 若 遇 杀手 刺杀 ,无 异 于 星 臂 当 车 ,自己 和 父亲 都 会 被 杀 , 暂 
且 将 其 损失 设 为 非常 大 的 10; 而 杀手 则 赚 得 迈克 尔 父 子 两 条 命 , 得 到 收益 为 10。 因 而 双 


@ 这 种 共同 知识 是 比较 意义 上 的 ,如 “迈克 尔 持 枪 把 守 ,杀手 继续 刺杀 "与 “迈克 尔 空 手 把 守 ,杀手 继续 刺杀 "两 
相 比 较 , 双 方 都 清楚 这 两 种 结果 的 熟 优 熟 劣 一 无 论 于 己 还 是 于 他 。 

加 ”当然 ,如 果 迈 克 尔 持 枪 躲藏 ,常会 在 杀手 出 现时 氢 枪 抵抗 ,此 时 需 将 模型 进一步 细 化 才能 完整 描述 。 有 兴趣 
的 读者 可 在 读 完 本 节 后 重建 新 模型 。 


第 4 章 完全 但 不 完美 信息 博弈 133 


自然 


刺杀 离开 刺杀 离开 刺杀 离开 刺杀 离开 
(35-5) (00) (354) (0.0) -10,10) (0.0) (-5,5) (0.0)》 


图 4-3 刺杀 博弈 


方 得 益 组 合 为 (一 10,10) 。 

(3) 当 迈 克 尔 空手 躲避 时 , 若 遇 杀手 刺杀 ,他 自己 可 能 侥幸 逃脱 ,但 是 父亲 被 杀 几 无 
悬念 , 设 其 损失 为 5; 而 杀手 则 达到 目的 ,得 到 收益 5。 因 而 双方 得 益 组 合 为 (一 5,5) 。 

(4) 当 迈 克 尔 持 枪 把 守 时 ,杀手 若 刺杀 ,有 可 能 遭遇 伏击 ,双方 激战 。 双 方 得 益 为 
(一 5, 一 5) 。 

(5) 当 迈 克 尔 持 枪 躲 避 时 ,杀手 若 刺 杀 , 则 能 够 顺利 进入 医院 走 近 教父 ,实施 计划 ; 
当然 ,迈克 尔 也 可 能 绝境 还 击 , 致 杀手 受伤 。 无 论 如 何 , 此 时 的 躲避 并 非 伏击 ,而 是 真实 意 
愿 ,因此 从 期 望 意义 上 讲 ,迈克 尔 躲 避 时 略 显 被 动 。 因 此 双方 得 益 为 (一 5, 一 4) 。 

对 于 上 述 情形 ,传统 的 逆向 归纳 法 失灵 了 。 璧 如 在 图 4-3 的 节点 3 上 轮 到 杀手 选择 
时 ,如 果 按 照 传统 的 逆向 归纳 法 ,他 会 选择 离开 ,对 应 得 益 组 合 (0.0); 逆 推 至 节点 1 迈克 
尔 行动 时 ,他 也 预测 到 如 果 自 己 持 枪 把 守则 对 方 会 离开 ,因此 只 需 将 上 述 得 益 组 合 (0,0) 
中 自己 的 得 益 0 与 其 他 选择 时 所 对 应 的 得 益 进行 比较 即 可 。 但 是 此 处 的 杀手 并 不 知道 对 
方 是 否 持 枪 , 即 不 知道 自己 到 底 处 于 节点 3 还 是 节点 5。 然 而 在 节点 3 和 节点 5 时 杀手 
的 理性 选择 将 截然 不 同 。 因 此 ,他 将 不 知 自己 如 何 选择 。 当 然 , 逆 推 至 节点 1 迈克 尔 行动 
时 ,他 将 无 法 预测 杀手 的 理性 行为 ,因而 无 法 预测 持 枪 把 守 时 自己 的 得 益 , 更 无 从 与 其 他 
行为 下 的 得 益 进 行 比较 。 鉴 于 此 ,我 们 将 重新 定义 子 博弈 的 概念 ,并 发 展 出 完美 贝 叶 斯 均 
衡 的 概念 ,以 便利 用 简单 高 效 的 逆向 归纳 法 来 分 析 问 题 。 


4.1.3 不 完美 信息 博弈 的 子 博弈 


回忆 第 3 章 的 子 博弈 完美 纳什 均衡 的 求解 过 程 : 先 划 分 出 子 博弈 ,接着 使 用 逆向 归 
纳 法 求解 。 子 博弈 的 概念 使 得 问题 简化 : 每 个 子 博 弈 都 可 以 被 压缩 为 一 个 单 人 博弈 , 原 
博弈 可 逆序 转化 为 一 系列 的 单 人 博弈 ; 亦 即 轮 到 每 个 参与 者 做 决策 时 ,他 只 须 在 转化 后 的 
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单 人 博弈 中 做 出 选择 即 可 。 在 不 完美 信息 博弈 中 ,我 们 也 需要 一 个 类 似 于 * 子 博弈 "的 概念 。 
但 是 ,与 完全 完美 信息 动态 博弈 中 的 * 子 博弈 不同 ,不 完美 信息 博弈 中 出 现 了 多 节点 
信息 集 。 例 如 ,图 4-3 中 轮 到 杀手 行动 时 ,节点 3 和 节点 5 具有 相同 的 信息 集 , 因 此 将 它 
们 视 为 不 同 的 子 博弈 用 来 逆向 归纳 将 引起 混乱 。 这 点 在 第 3 章 介 绍 子 博弈 的 划分 时 已 经 
强调 过 , 子 博弈 不 能 分 割 任何 信息 集 。 为 了 更 深刻 地 理解 这 一 点 ,我 们 利用 猜 硬 币 博弈 做 
进一步 解释 。 在 猜 硬币 博弈 中 , 盖 硬 币 方 做 出 * 正 ?或 者 * 反 ”的 行动 后 , 轮 到 猜 硬币 方 来 行 
动 。 显 然 猜 硬币 方正 处 于 多 节点 信息 集中 ,忽略 信息 不 完美 将 会 出 现 图 4-4 所 示 结 果 。 


盖 硬 币 方 


\ 猪 硕 而 方 /7 

\ 猿 硬币 方 / 

了 站 sea 二 和 
1 


、 、 
CD OLD’ AU-D Ch) 


图 4-4 使 用 子 博弈 划分 方法 划分 猿 硬币 博弈 


图 4-4 中 虚线 部 分 是 两 个 子 博弈 ,为 何不 能 据 此 仿照 第 3 章 来 逆向 归纳 呢 ? 因为 猜 
硬币 方 在 该 节点 做 出 的 决定 毫 无 意义 ! 在 这 个 博弈 进程 中 , 盖 硬 币 方 先 做 了 一 个 决策 ,再 
轮 到 猜 硬币 方 。 事 实 上 , 猜 硬币 方 在 做 出 选择 时 ,还 不 知道 自己 处 于 哪个 节点 。 既 然 不 知 
道 处 于 哪个 节点 ,单独 分 析 该 节点 的 得 益 就 没有 价值 。 例 如 , 猜 硬币 方针 对 子 博弈 1 而 猜 
“ 正 ”, 实 际 上 他 既 可 能 处 于 子 博弈 1 中 ,也 可 能 处 于 子 博 弈 2 中 。 一 旦 是 处 于 子 博 弈 2 
中 ,显然 “ 正 ? 并 不 是 理性 选择 。 因 此 , 猜 硬 币 方 所 做 的 决定 应 该 建立 在 权衡 两 种 可 能 性 的 
基础 之 上 ,而 不 应 该 针对 某 个 单一 个 节点 。 

为 了 避免 混乱 ,我 们 仍 沿用 第 3 章 * 子 博弈 ”的 概念 ,如 图 4-4 中 的 子 博弈 1 和 子 博 弈 
2。 但 是 只 有 " 子 博 弈 ?是 不 够 的 ,此 处 需要 一 个 满足 更 高 要 求 的 概念 , 即 不 能 分 割 任何 信 
息 集 。 我 们 把 不 完美 信息 博弈 中 没有 分 割 信息 集 的 子 博弈 称 为 “标准 子 博弈 "。 可 见 , 标 
准 子 博弈 是 符合 特定 条 件 的 一 类 子 博 弈 。 那 么 ,如 何 获取 一 个 不 完美 信息 博弈 的 标准 子 
博弈 呢 ? 

事实 上 ,标准 子 博弈 ?是 “ 子 博弈 ?的 子 集 , 子 博弈 和 标准 子 博弈 之 间 是 包含 与 被 包含 
的 关系 。 因 此 ,沿用 子 博弈 的 划分 方法 ,去 掉 非 “标准 子 博弈 ”就 剩 下 了 ”标准 子 博 弈 ”。 
所 以 ,按照 * 找 出 子 博弈 一 去 掉 非 标准 子 博弈 ?的 思路 即 可 找 出 标准 子 博弈 。 仍 然 采 用 猜 
硬币 博弈 来 分 析 。 

首先 , 找 出 所 有 子 博 弈 。 如 图 4-5 所 示 。 

然后 ,标记 出 分 割 了 信息 集 的 子 博弈 。 如 图 4-6 中 被 又 状 标记 的 两 个 子 博弈 。 

最 后 ,去 掉 被 标记 的 子 博弈 。 剩 余 所 得 即 为 标准 子 博弈 。 如 图 4-6 被 勾 状 标记 的 子 

总 结 如 下 。 欲 寻找 一 个 博弈 的 “标准 子 博弈 ”, 步 又 可 为 三 步 。 

(1) 利用 第 3 章 的 方法 , 找 出 一 个 博弈 所 有 的 子 博弈 .并 在 图 上 画 圈 来 表示 。 
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盖 硬 币 方 


图 4-5 猜 硬币 博弈 的 三 个 子 博 弈 


盖 硬 币 方 


图 4-6 猜 硬 币 博弈 的 标准 子 博弈 


(2) 标记 出 被 分 割 了 信息 集 的 子 博弈 。 

如 果 两 个 子 博弈 并 非 隶 属 关系 ,但 是 至 少 存在 一 对 分 属 不 同 子 博弈 的 节点 拥有 完全 
相同 的 信息 集 , 则 称 它 们 为 被 分 割 了 信息 集 的 子 博弈 。 

(3) 去 掉 被 标记 的 子 博弈 , 剩 下 的 子 博 弈 即 不 完美 信息 博弈 中 的 标准 子 博弈 。 


分 思考 与 练习 
请 找 出 图 4-3 刺杀 博弈 中 的 所 有 标准 子 博弈 。 


4.2 完美 贝 叶 斯 均衡 


上 一 节 探 讨 了 不 完美 信息 博弈 的 基本 概念 .引入 了 ”自然 "这 一 虚拟 参与 者 ,同时 指出 
子 博 弈 的 概念 需要 更 新 为 标准 子 博弈 。 那 么 ,第 3 章 的 子 博 弈 完美 纳什 均衡 在 不 完美 信 
息 博 弈 中 还 具有 很 好 的 分 析 性 质 吗 ? 由 于 不 完美 信息 下 的 扩展 型 包含 了 至 少 一 个 多 节点 
信息 集 , 这 导致 子 博弈 完美 纳什 均衡 无 法 适用 ,至 少 对 部 分 阶段 如 此 。 这 一 点 在 上 一 节 介 
绍 子 博弈 时 已 经 涉及 。 因 此 ,我 们 需要 定义 一 个 新 的 均衡 用 以 解决 这 个 问题 。 实 际 上 ,在 
博弈 理论 中 存在 着 多 个 均衡 的 概念 ,都 在 尝试 解释 博弈 参与 者 的 行为 理性 。 本 书 将 主要 
介绍 常见 的 完美 贝 叶 斯 均衡 (perfect bayesian equilibrium, 又 名 精练 贝 叶 斯 均衡 ) , 它 是 子 
博弈 完美 均衡 在 贝 叶 斯 法 则 下 的 精练 。 当 然 , 有 兴趣 的 读者 也 可 查阅 其 他 均衡 概念 的 资 
料 ,如 序 贯 均衡 和 颤抖 手 均衡 等 。 
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4.2.1 新 均衡 的 4 个 要 求 


既然 纳什 均衡 和 子 博弈 完美 均衡 在 不 完美 信息 中 都 不 能 很 好 地 预测 参与 者 的 行为 。 
因此 需要 一 个 新 的 均衡 概念 来 解释 参与 者 的 行为 理性 。 

回 到 上 文 的 刺杀 博弈 (图 4-3) ,让 我 们 分 析 迈 克 尔 和 杀手 应 该 如 何 行动 才 是 理性 的 ， 
亦 即 应 如 何 描述 他 们 之 间 的 策略 均衡 。 

首先 ,从 博弈 的 起 点 开始 ,自然 选择 和 参与 者 的 判断 。 如 前 所 述 ,“ 自 然 ” 决 定 是 否 持 
枪 ,这 是 一 个 随机 事件 。 尽 管 本 书 强调 是 否 持 枪 的 可 能 性 不 受 个 人 行为 的 影响 ,是 客观 存 
在 的 概率 。 但 是 这 种 概率 并 非 清楚 明白 地 写 在 纸 上 。 实 际 上 它 表现 为 一 种 主观 感知 一 一 
杀手 对 客观 概率 的 主观 认识 。 假 如 杀手 在 途中 被 告知 将 同 迈 克 尔 有 场 博弈 ,那么 他 会 快 
速 形成 关于 迈克 尔 是 否 带 枪 的 经 验 性 认识 。 尽 管 杀手 无 法 说 出 迈克 尔 持 枪 可 能 性 的 具体 
值 ,但 是 他 有 一 些 基 本 的 判断 : 几乎 不 带 枪 还 是 很 可 能 带 枪 ? 若 与 某 些 类 似 经 历 比 较 , 这 
次 持 枪 的 可 能 性 大 一 些 抑或 相反 ? 等 等 。 在 博弈 分 析 中 ,需要 将 上 述 判 断 清晰 化 ,因此 ， 
要 求 杀手 知道 所 有 可 能 结果 的 概率 分 布 ( 持 枪 和 不 持 枪 这 两 种 结果 的 概率 )。 上 述 “ 判 断 ” 
( 亦 称 “信念 ”) 是 先 验 的 , 意 即 建立 在 经 验 、 数 据 或 逻辑 分 析 之 上 。 但 同时 ,杀手 的 判断 不 
能 脱离 实际 ,这 是 博弈 参与 者 的 理性 要 求 。 因 此 ,理性 要 求 参与 者 根据 他 人 行为 对 是 否 持 
枪 做 出 事后 推断 ,使 得 自己 的 信念 与 双方 的 策略 保持 一 致 。 一 般 来 讲 ,这 种 推断 是 后 验 
的 。 例 如 ,“ 当 迈克 尔 把 守 时 迈克 尔 持 枪 ”的 可 能 性 与 " 当 迈 克 尔 向 藏 时 迈克 尔 持 枪 ” 的 可 
能 性 ,二 者 都 是 杀手 的 信念 。 一 般 来 讲 二 者 并 不 相等 .而且 与 “自然 "所 决定 的 “迈克 尔 持 
枪 ” 的 可 能 性 有 所 差异 。 


< 辣 Wi 信 他 该; 多 蛤 内 平和 后 验 人 


先 验 概率 是 指 根 据 以 往 的 经 验 数据 或 逻辑 分 析 而 得 到 的 概率 ; 而 后 验 概率 则 可 被 理 
解 为 条 件 概率 ,是 指 借 由 某 一 事件 的 发 生 而 推断 另 一 事件 发 生 的 可 能 性 。 

例如 , 某 人 打算 购买 一 注 双 色 球 福利 彩票 。 根 据 概率 论 可 算得 中 奖 概率 为 6.7%, 那 
么 他 据 此 推断 自己 中 奖 的 概率 也 是 6.7% 左 右 。 这 个 结果 来 自 人 逻辑 分 析 , 是 事前 的 、 先 验 
的 。 但 是 ,如 果 此 人 在 一 天 内 连续 看 到 20 人 中 奖 , 那 么 他 将 调 高 自己 的 预期 , 意 即 自己 的 
中 奖 概率 。 这 个 被 调 高 的 中 奖 概率 即 是 后 验 概率 ,是 他 在 某 些 事件 发 生 后 对 中 奖 概率 的 
感知 。 

又 如 , 某 手 机 厂商 有 一 批 同型 号 不 同 车 间 的 手机 存在 质量 缺陷 ,需要 召回 。 东 海 、 北 
原 、 西 山 三 个 车 间 的 产量 分 别 占 总 产量 的 25%% ,35%% ,40%% ,故障 率 分 别 为 5% ,4%% ,2%。 
现 从 该 厂 生 产 的 手机 中 随机 抽取 一 件 , 检 查 是 否 有 故障 。 设 B。:“ 手 机 来 自 东 海 车 间 ”; 
B,:“ 手 机 来 自 北 原 车 间 ”; Bw:“ 手 机 来 自 西山 车 间 ”。 那 么 任 取 一 部 手机 , 问 来 自 哪 个 
车 间 ? 则 P(B1) 一 0.25,P(Bz) 一 0.35,P(Bs) 一 0.4。 这 些 都 是 根据 数据 统计 出 的 结果 ， 
是 既定 的 、 先 验 的 ,因此 被 称 作 先 验 概率 。 同 时 , 令 A 表示 “所 取 产 品 为 故障 品 ”"。 那 么 ， 
Bi/A 表示 “ 任 选 一 部 手机 ,在 有 故障 的 条 件 下 它 来 自 第 i 车间”(i 二 e,n,tw)。 根 据 全 概率 
公式 和 贝 叶 斯 法 则 ,计算 可 知 P(B。/A) 二 0. 362 3,P(B,/A) 二 0.405 8,P(Bw/A) 二 0.231 9。 
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这 些 便 是 后 验 概率 ,是 在 所 取 产 品 被 认定 为 次 品 后 评估 它 来 自 第 i 车 间 的 概率 。 

比较 先 验 概率 和 后 验 概率 ,可 见 二 者 是 不 同 的 概念 ,如 上 例 。 如 果 你 朋友 拿 了 一 部 该 
型 号 的 新 手机 找到 你 , 问 是 哪 家 车 间 生 产 的 。 那 么 西山 生产 的 可 能 性 最 大 ,40%。 过 了 半 
年 他 又 来 找 你 ,发 现 手机 有 故障 , 问 它 可 能 是 哪个 车 间 生 产 的 ? 你 应 该 告诉 他 ,最 可 能 是 
北原 ! 


例如 ,在 图 4-3 中 ,自然 以 概率 1/2 选择 持 枪 戒备 ,以 概率 1/2 选择 赤 手 空 源 。 可 

记 作 
P( 持 枪 )= 二 1/2， P( 空 手 )=1/2 

这 是 先 验 的 。 当 杀手 走 到 节点 3 或 5 时 , 需 对 杀手 是 否 持 枪 做 出 判断 , 即 推断 "在 看 到 迈 
克 尔 把 守 时 他 持 枪 ”的 概率 和 “在 看 到 迈克 尔 把 守 时 他 空手 ”的 可 能 性 ,分 别 记 作 已 ( 持 枪 / 
把 守 ) 、.P( 空 手 / 把 守 ); 走 到 节点 4 或 6 时 亦 然 ,杀手 的 判断 分 别 记 作 P( 持 枪 /躲避 ) 、P 
(空手 /躲避 )。 不 妨 假设 : 

已 ( 持 枪 /把 守 ) 王 2/3; P( 空 手 /把 守 ) 王 1/3; ( 持 枪 /躲避 ) 一 0; P( 空 手 / 躲 避 ) 王 1 
它们 表示 杀手 在 观察 到 把 守 或 躲避 时 对 迈克 尔 是 否 持 枪 的 具体 信念 水 平 。 如 图 4-7 
所 示 。 


自然 
持 枪 天 备 _(@)、 赤 手 空 关 
12 © 二 区 


刺杀 离开 刺杀 离开 刺杀 离开 刺杀 离开 
(5-5) (0,0) (-5.-4) (0,0) (-10.10) (0,0) (~5.5)) (0,0) 


图 4-7 刺杀 博弈 中 的 信念 


推 而 广 之 ,新 的 均衡 概念 需 满足 第 1 个 要 求 : 在 各 个 信息 集 ,参与 者 必须 具有 一 个 关 
于 博弈 达到 该 信息 集中 每 个 节点 可 能 性 的 “判断 ”, 也 称 “信念 ”。 对 非 单 节点 信息 集 , 一 个 
“信念 ”就 是 博弈 达到 该 信息 集中 各 个 节点 可 能 性 的 概率 分 布 ,对 单 节点 信息 集 则 可 理解 
为 “判断 达到 该 节点 的 概率 为 1”。 

其 次 ,关于 参与 者 的 理性 要 求 。 尽 管 杀手 不 清楚 迈克 尔 是 否 持 枪 ,但 是 二 人 的 行动 是 
动态 的 ,这 点 毋庸 置疑 。 因 此 与 第 3 章 所 遇 到 的 问题 一 样 ,二 人 的 行动 是 相机 选择 的 , 任 
何 承诺 和 威胁 都 不 一 定 可 信 。 所 以 ,序列 理性 的 要 求 在 不 完美 信息 博弈 的 均衡 处 仍然 适 
用 。 换言之 ,不 管 历史 行动 如 何在 以 后 的 任何 节点 , 轮 到 行动 的 参与 者 的 占 优 策 略 都 应 
使 自己 的 “得 益 最 大 化 ”。 这 点 是 共同 知识 。 轮 到 迈克 尔 行动 时 ,他 的 策略 应 该 是 最 大 化 
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自身 得 益 ; 杀手 亦 如 此 ,而 且 迈 克 尔 也 知道 杀手 将 如 此 。 因 此 ,无论 迈克 尔 如 何 行动 , 杀 
手 都 会 在 看 到 行动 后 做 出 反应 最 大 化 自身 得 益 。 当 然 ,在 不 完美 信息 博弈 中 参与 者 的 “得 
益 最 大 化 ”应 准确 表述 为 “期 望 得 益 最 大 化 ”0。 

假设 有 以 下 策略 组 合 C, 让 我 们 来 验证 它 是 否 满足 序列 理性 。 

迈克 尔 : 若 持 枪 戒 备 , 则 始终 把 守 ; 若 赤 手 空 举 , 则 以 0.5 的 概率 把 守 ,0.5 的 概率 

杀手 : 若 遇 把 守 , 则 以 0.5 的 概率 刺杀 ,0.5 的 概率 离开 ; 若 遇 躲避 , 则 始终 刺杀 。 

杀手 的 信念 : P( 持 枪 /把 守 ) 二 2/3; P( 空 手 / 把 守 ) 二 1/3; 忆 ( 持 枪 /躲避 ) 一 0; 已 ( 空 
手 / 躲 避 ) 一 1。 

(1) 先 从 最 后 的 阶段 开始 ,考察 杀手 的 理性 选择 。 


当 迈 克 尔 把 守 时 , 若 杀 手 刺杀 则 他 的 期 望 得 益 为 也 X (一 5) 十 计 X10 一 0; 车 杀手 离 


开 则 期 望 得 益 为 0。 两 种 行动 对 于 杀手 而 言 得 益 相同 ,因此 杀手 的 策略 (0.5,0.5) 也 是 一 
个 弱 占 优 策 略 。 

当 迈 克 尔 躲避 时 ,杀手 推断 他 一 定 没 带 枪 。 所 以 ,杀手 选择 刺杀 时 的 得 益 为 0X 
(一 4 十 1X5 二 5。 将 之 与 离开 时 的 得 益 0 相 比较 ,可 知 杀手 一 定 选择 刺杀 。 

综合 可 知 ,杀手 的 策略 满足 序列 理性 的 约束 。 

(2) 再 考虑 上 一 阶段 迈克 尔 的 选择 。 由 于 迈克 尔 知道 自己 是 否 持 枪 , 因 此 将 分 两 种 
情况 讨论 ,而 不 是 计算 期 望 收益 。 

当 和 迈克 尔 持 枪 且 把 守 时 ,杀手 将 采取 混合 策略 (0.5,0. 5) ,此 时 迈克 尔 的 期 望 得 益 为 
0.5X( 一 5) 十 0.5X0 二 一 2.5。 当 迈克 尔 持 枪 且 答 避 时 ,杀手 将 采取 刺杀 策略 ,迈克 尔 的 
得 益 为 一 5。 比 较 可 知 ,迈克 尔 将 始终 选择 把 守 。 

当 迈 克 尔 空手 且 把 守 时 ,杀手 依然 采取 混合 策略 (0. 5.0.5), 此 时 迈克 尔 的 期 望 得 益 
为 0.5X( 一 10) 十 0.5X0 王 一 5。 当 迈克 尔 持 枪 且 躲避 时 ,杀手 将 采取 刺杀 策略 。 此 时 迈 
克 尔 的 得 益 为 一 5 ,与 空手 把 守 时 相同 ! 因此 ,迈克尔 的 混合 策略 (0.5,0. 5) 是 一 个 弱 占 优 
策略 。 

综 上 ,迈克 尔 的 策略 满足 序列 理性 的 要 求 。 

可 以 设想 ,如 果 二 人 中 有 一 人 的 策略 不 是 占 优 的 ,他 将 调整 自己 的 策略 使 之 满足 序列 
理性 的 要 求 。 既 然 如 此 ,杀手 关于 迈克 尔 是 否 持 枪 的 信念 也 将 随 之 变化 。 具 体 应 如 何 变 
化 ,请 见 下 文 的 要 求 3 和 要 求 4。 

总 之 ,新 的 均衡 概念 需 满足 第 2 个 要 求 : 给 定 参与 者 的 信念 ,均衡 策略 必须 是 “序列 
理性 ”的 。 换 言 之 ,无 论 历史 行动 如 何 , 当 轮 到 一 个 参与 者 行动 时 ,他 的 均衡 策略 在 以 后 任 
何 阶段 都 是 占 优 的 。 

最 后 ,关于 杀手 的 信念 所 需 满 足 的 要 求 。 要求 1 和 要 求 2 只 是 保证 了 杀手 持 有 信念 、 


@ 期望 得 益 最 大 化 并 不 是 参与 者 决策 时 唯一 的 处 理 准则 ,实际 上 还 有 诸如 最 小 后 悔 值 准则 、 最 大 最 小 值 准 
则 等 。 
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并 在 给 定 信念 下 选择 占 优 策略 。 但 是 它们 并 没有 涉及 如 何 形成 信念 并 检验 信念 是 否 合 
理 。 实 际 上 ,既然 杀手 的 信念 是 后 验 概率 ,那么 它 应 该 满足 贝 叶 斯 法 则 。 例 如 ,由 双方 的 
策略 可 知 : 
P( 把 守 / 持 枪 ) = 1,P( 躲 避 / 持 枪 ) = 0,P( 把 守 / 空手) = 0.5,P( 躲 避 / 持 枪 ) 一 0.5 
又 由 自然 选择 可 知 : 

P( 持 枪 ) = 二 0.5， P( 空 手 ) 二 0.5 
根据 贝 叶 斯 法 则 ,在 迈克 尔 把 守 时 杀手 推断 他 持 枪 的 概率 为 


a P( 持 枪 )P( 把 守 / 持 枪 ) 
P( 持 枪 / 把 守 ) 二 (等 检 )P( 肥 守 / 持 枪 ) 十 P( 罕 手 )P( 拒 村/ 至 手 ) 
05 XL 2 


(4-1) 


0.5X1+0.5X0.5 3 
而 这 正好 与 策略 组 合 C 中 杀手 的 信念 一 致 ! 同 理 可 计算 杀手 关于 迈克 尔 的 其 他 判断 ,不 
难 检验 它们 都 与 杀手 的 信念 一 臻 。 只 有 信念 和 事实 一 致 ,才能 说 明 杀 手 的 判断 是 合理 的 。 
不 妨 假设 策略 组 合 C 是 一 个 均衡 。 注 意 到 策略 组 合 中 包含 了 双方 的 混合 策略 ,因此 
无 论 躲 避 还 是 把 守 、 刺 杀 还 是 离开 ,只 要 有 可 能 实施 ,都 应 该 在 均衡 的 考虑 范围 内 。 简 言 
之 ,任何 概率 大 于 0 的 行动 都 有 可 能 被 选择 ,都 应 在 均衡 路 径 之 上 ; 而 概率 为 0 的 行动 都 
不 可 能 被 选择 ,因此 不 在 均衡 路 径 之 上 。 如 图 4-8 所 示 , 双 实 线路 径 0-1-3-7、0-1-3-8、0-2- 
5-11 .0-2-5-12 和 0-2-6-13 等 都 在 均衡 路 径 上 。 余 者 皆 不 在 均衡 路 径 上 ,如 双 虚 线路 径 
0-1-4-9 等 。 正 如 式 (4-1) 的 计算 一 样 ,在 均衡 路 径 上 的 所 有 信念 都 必须 满足 贝 叶 斯 法 则 ， 
同时 受制 于 双方 的 策略 ( 亦 即 选择 所 有 可 能 行动 的 概率 ) 。 
自然 
持 枪 戒备 A@、、 赤 于 空 拳 


刺杀 离开 刺杀 离开 刺杀 离开 刺杀 离开 
(-5.-5) (0.0) (-5.-4) (0.0) (-10.10) (0.0) (-5.5) (0.0) 


图 4-8 均衡 路 径 和 非 均衡 路 径 


所 以 ,新 的 均衡 概念 还 需 满足 第 3 个 要 求 : 在 均衡 路 径 上 的 信念 由 贝 叶 斯 法 则 和 各 
参与 者 的 均衡 策略 决定 。 

在 均衡 路 径 上 的 策略 必须 是 理性 的 、 占 优 的 ,因此 对 信念 的 要 求 也 应 与 序列 理性 保持 
一 致 。 一 般 来 讲 ,对 非 均衡 路 径 上 的 信念 可 置之不理 。 但 是 ,在 某 些 情 况 下 这 样 做 将 会 给 
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分 析 带 来 麻烦 。 为 了 说 明 这 一 点 ,考虑 路 径 0-1-4-9 所 对 应 的 策略 组 合 及 信念 已 ( 持 枪 / 躲 
避 ) 王 0。 这 条 路 径 所 对 应 的 策略 满足 要 求 1 和 要 求 2, 而 且 满 足 贝 叶 斯 法 则 。 除 了 不 在 
均衡 路 径 上 , 它 与 均衡 路 径 上 的 策略 并 无 二 致 。 因 此 如 果 有 人 质疑 为 何不 将 这 条 路 径 也 
纳入 均衡 ,将 会 难以 解释 。 但 实际 上 迈克 尔 绝 无 可 能 在 带 枪 时 选择 躲避 一 一 因为 概率 是 
0。 所 以 ,为 了 剔除 这 类 策略 ,需要 对 非 均衡 路 径 上 的 策略 也 做 出 要 求 。 

新 的 均衡 概念 还 需 满足 第 4 个 要 求 : 在 非 均衡 路 径 上 的 信念 由 贝 叶 斯 法 则 和 各 参与 
者 在 此 处 可 能 有 的 均衡 策略 决定 。 

此 时 ,杀手 的 信念 虽然 满足 贝 叶 斯 法 则 ,但 是 并 不 满足 由 各 参与 者 在 此 处 的 可 能 均 
衡 策 略 决定 ”。 璧 如 ,迈克尔 在 带 枪 时 选择 了 躲避 , 则 杀手 的 信念 必须 更 新 为 P( 持 枪 / 舱 
避 ) 二 0。 既 然 如 此 ,杀手 和 和 迈克 尔 的 策略 也 必须 做 相应 的 改变 。 那 么 改变 后 的 可 能 均衡 
就 不 再 是 路 径 0-1-4-9。 所 以 该 路 径 不 能 同时 满足 要 求 1 一 4, 得 以 排除 。 

综 上 可 知 ,新 均衡 的 定义 需要 满足 如 下 4 个 要 求 。 

(1) 在 各 个 信息 集 , 参 与 者 必须 具有 一 个 关于 博弈 达到 该 信息 集中 每 个 节点 可 能 性 
的 信念 。 

(2) 给 定 参 与 者 的 信念 ,均衡 策略 必须 是 “序列 理性 ”的 。 换 言 之 ,无 论 历史 行动 如 
何 , 当 轮 到 一 个 参与 者 行动 时 ,他 的 均衡 策略 在 以 后 任何 阶段 都 是 占 优 的 。 

(3) 在 均衡 路 径 上 的 信念 由 贝 叶 斯 法 则 和 各 参与 者 的 均衡 策略 决定 。 

(4) 在 非 均衡 路 径 上 的 信念 由 贝 叶 斯 法 则 和 各 参与 者 在 此 处 可 能 有 的 均衡 策略 决 
定 。 简 言 之 ,任何 到 达 概率 大 于 0 的 节点 都 应 在 均衡 路 径 之 上 ; 而 到 达 概 率 为 0 的 节点 
都 不 在 均衡 路 径 之 上 。 

上 述 4 点 要 求 不 仅 适 用 于 刺杀 博弈 的 均衡 ,也 适用 于 一 般 的 不 完美 信息 博弈 。 同 时 
满足 上 述 4 点 要 求 的 均衡 被 称 为 完美 贝 叶 斯 均衡 。 


4.2.2 完美 贝 叶 斯 均衡 的 定义 


上 一 节 结 合 案例 对 完美 贝 叶 斯 均 衔 提出 了 4 个 要 求 。 相 对 严谨 的 表述 可 见 如 下 
内 容 。 

要 求 1: 在 各 个 信息 集 , 轮 到 选择 的 参与 者 必须 拥有 一 个 关于 博弈 达到 该 信息 集中 每 
个 节点 可 能 性 的 “信念 ”。 对 多 节点 信息 集 , 一 个 “信念 ”就 是 博弈 达到 该 信息 集中 各 个 节 
点 可 能 性 的 概率 分 布 ; 对 单 节 点 信息 集 , 则 可 理解 为 "判断 达到 该 节点 的 概率 为 1”。 

要 求 2: 给 定 各 参与 者 的 信念 ,参与 者 的 策略 必须 是 “序列 理性 ”的 。 意 即 , 在 各 个 信 
息 集 ,给 定 参 与 者 的 信念 和 其 他 参与 者 的 “后 续 策略 ”, 该 参与 者 的 行动 及 其 后 阶段 的 “后 
续 策略 ”, 必 须 使 自己 的 得 益 或 期 望 得 益 最 大 。 所 谓 “ 后 续 策略 ”, 即 参与 者 策略 中 自 该 信 
息 集 之 后 的 部 分 所 构成 的 策略 。 

要 求 3: 在 均衡 路 径 上 的 信息 集 处 “判断 ”由 贝 叶 斯 法 则 和 各 参与 者 的 均衡 策略 
决定 。 

要 求 4: 在 不 处 于 均衡 路 径 上 的 信息 集 处 “判断 ”由 贝 叶 斯 法 则 和 各 参与 者 在 此 处 可 
能 有 的 均衡 策略 决定 。 
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补充 说 明 : 对 于 给 定 扩展 型 博弈 中 的 给 定 均衡 ,如 果 博 弈 根据 均衡 策略 进行 时 将 以 
正 的 概率 到 达 某 信息 集 , 则 称 此 信息 集 处 于 均衡 路 径 之 上 ; 反之 ,如 果 博 弈 根据 均衡 策略 
进行 时 肯定 不 会 到 达 某 信息 集 , 则 称 之 为 处 于 均衡 路 径 之 外 的 信息 集 。 

在 完全 但 不 完美 信息 博弈 中 ,满足 上 述 4 个 要 求 的 策略 组 合 连同 相应 信念 被 称 为 完 
美 贝 叶 斯 均衡 。 

要 求 1 一 3 不 仅 包括 贝 叶 斯 博弈 的 主要 思想 ,而 且 也 构成 了 完美 贝 叶 斯 均衡 的 定义 。 
与 前 几 章 的 纳什 均衡 和 子 博弈 完美 均衡 不 同 , 在 完美 贝 叶 斯 均衡 中 信念 被 提 到 了 与 策略 
同等 重要 的 地 位 。 具 体 而 言 ,一 个 均衡 不 再 只 是 由 每 个 参与 者 的 策略 所 构成 ,还 包括 了 参 
与 者 在 轮 到 他 行动 时 对 自己 位 置 的 推断 。 就 上 述 4 个 要 求 而 言 ,不 同 的 学 者 或 教材 曾 使 
用 过 不 同 的 完美 贝 叶 斯 均衡 定义 。 但 是 所 有 的 定义 都 包括 要 求 1 一 3, 同 时 大 多 数 定义 也 
包含 了 要 求 4; 甚至 还 有 些 定义 包含 了 更 进一步 的 要 求 。 

为 何 有 这 4 个 要 求 ? 这 点 在 上 文 的 刺杀 博弈 中 已 经 做 了 简单 分 析 。 要 求 1 的 作用 是 
保证 参与 者 拥有 判断 ,将 信息 不 完美 的 博弈 转化 为 可 分 析 的 扩展 型 表示 ; 要 求 2 的 作用 
是 保证 参与 者 的 序列 理性 ,消除 动态 行动 中 的 不 可 置信 承诺 (或 威胁 ); 要 求 3 是 为 信念 
的 赋予 和 更 新 提供 一 般 准则 ,使 之 与 均衡 策略 保持 一 致 变动 ,而 要 求 4 则 意 在 排除 某 些 不 
可 能 到 达 的 所 谓 " 均 衡 ”。 

同时 ,必须 强调 完美 贝 叶 斯 均衡 所 体现 的 一 致 性 。 所 谓 一 致 性 ,要 求 各 种 信念 之 间 必 
须 一 致 ,而 且 信念 要 与 参与 者 的 策略 一 致 。 关 于 各 种 信念 之 间 的 一 致 性 ,一 般 要 求 信 念 是 
参与 者 的 共同 知识 。 例 如 ,在 刺杀 博弈 中 杀手 清楚 自己 的 信念 ,迈克 尔 也 知道 杀手 的 信 
念 ,杀手 也 知道 迈克 尔 知 道 自己 的 信念 …… 只 有 这 样 才 能 保证 双方 对 均衡 预测 的 一 致 性 。 
而 关于 信念 与 策略 之 间 的 一 致 性 ,在 任 一 个 与 参与 者 策略 相 一 致 的 信息 集合 中 关于 已 发 
生 历 史 的 信念 应 该 源 自 这 些 使 用 贝 叶 斯 法 则 的 策略 。 简 言 之 , 当 策 略 变化 时 ,信念 也 应 该 
随 之 变化 。 在 贝 叶 斯 法 则 下 ,信念 的 赋予 和 更 新 依赖 于 参与 者 的 策略 ,而 策略 又 是 在 给 定 
参与 者 信念 下 的 最 优 反 应 。 这 种 循环 性 使 得 人 们 不 能 仅仅 依靠 逆向 归纳 来 确定 均衡 , 同 
时 信念 的 更 新 也 无 法 与 策略 调整 同步 实现 ,只 能 是 后 验 的 。 

为 了 更 深刻 地 理解 完美 贝 叶 斯 均衡 ,请 看 接 下 来 的 实例 。 


4.3 古玩 旧 货 市 场 : 总 有 不 完美 


< 引 语 故 事 , 古玩 市 场 


1994 年 ,一 名 专家 在 北京 潘 家 园 旧 货 交 易 市 场 闲 违 时 ,发 现 了 一 批 北 魏 陶 俑 。 它 们 
的 形态 从 未 现世 。 所 见 者 几乎 一 致 认为 : 这 是 北魏 时 期 的 珍贵 文物 ,而 且 很 可 能 是 前 不 
久 刚 被 媒体 披露 的 被 次 的 北魏 莫 里 的 陪葬 品 。 

专家 们 使 用 了 考古 中 常用 的 年 代 测 定 手段 一 一 碳 14 断代 法 进行 检测 ,发 现 这 批 陶 俑 
在 年 代 上 与 北魏 完全 吻合 。 某 博物 馆 还 邀请 了 当时 北京 几乎 所 有 的 顶级 考古 学 家 、 鉴 定 
专家 “过 眼 ”, 他 们 一 致 认可 为 真品 。 于 是 ,专家 申请 拨 专 款 、 专 项 抢救 性 收购 古玩 市 场 上 
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的 “北魏 珍贵 陶 俑 ”。 

不 料 ,类 似 的 “出 土 文物 ” 竟 源 源 不 断 地 出 现在 北京 的 文物 市 场 。 国 家 文物 局 为 此 事 
成 立 了 专案 组 ,后 经 调查 发 现 : 这 批文 物 实 为 履 品 ,是 一 位 “民间 艺术 家 ”所 做 的 高 仿 艺 术 
品 。 而 报纸 上 所 刊登 的 北魏 大 莫 被 盗 的 消息 ,也 是 倒卖 这 些 作品 的 古董 商 故意 释放 出 的 

实际 上 ,有 专家 指出 在 古玩 市 场 中 有 九 成 以 上 是 屡 品 ,甚至 更 高 。 正 如 一 位 收藏 专家 
感叹 ;“ 现 在 市 面 上 屡 品 ,仿制 品 很 普遍 ,很 少 能 像 前 几 年 那样 “ 捡 汤 ', 花 小 价钱 买 到 真 宝 
喘 竺 *” 


在 古玩 旧 货 市 场 ,卖家 对 “藏品 ”的 真 伪 非 常 清楚 ,而 买 家 则 不 知 底细 ,只 能 凭借 自身 
推断 或 所 谓 的 专家 鉴定 。 与 买 家 相 比 ,卖家 占据 着 显著 的 信息 优势 。 那 么 ,在 这 种 信息 不 
对 称 时 双方 应 该 如 何 理性 行动 呢 ? 这 种 信息 不 对 称 对 古玩 旧 货 市 场 的 发 展 又 有 什么 影响 
呢 ? 接 下 来 我 们 将 通过 不 完美 信息 博弈 来 分 析 藏 品 市 场 上 买卖 双方 的 策略 ,并 进一步 分 
析 他 们 对 市 场 发 展 的 影响 。 

对 于 购买 藏品 的 买 家 而 言 ,藏品 是 否 为 真 完全 是 个 随机 事件 ,大致 由 市 场 中 流通 真品 
的 比例 决定 。 仿 照 前 例 , 引 入 虚拟 参与 者 "自然 ”由 自然 决定 买 家 遇 到 硕 品 的 概率 。 

简单 起 见 ,我 们 仅 关注 “ 古 币 ” 这 一 类 别 的 藏品 。 由 于 古 币 是 标准 化 商品 ,流通 数量 
多 ,因此 有 相对 客观 的 定价 参照 。 假 设 买 卖 双方 都 没有 定价 权 , 交 易 价格 由 市 场 决 定 , 这 
是 双方 的 共同 知识 。 同 时 ,依照 旧 货 市 场 的 所 谓 “ 潜 规则 ”, 交 易 完成 后 不 能 退换 货 , 意 即 
行动 后 不 能 反悔 。 双 方 的 行动 分 别 是 买 和 不 买卖 和 不 卖 。 仿 照 前 文 ,构建 如 下 博弈 : 首 
先 由 “自然 "决定 真品 的 概率 ; 卖家 决定 是 否 将 收购 到 的 “藏品 " 拿 到 市 场 上 出 售 ; 买 家 看 
到 “藏品 "后 决定 是 否 购买 。 另 外 ,如 果 古 币 是 恬 品 且 卖 家 决定 出 售 ,那么 他 需要 花 钱 去 伪 
装 , 如 设 局 、 做 旧 等 。 这 些 花 费 统 称 为 伪装 成 本 。 


4.3.1 单一 价格 交易 


假设 真品 对 于 买 家 的 价值 为 w , 厅 品 的 价值 为 w。 由 于 买 家 的 “淘宝 "心态 ,所 以 无 
论 真品 还 是 厢 品 ,卖家 都 想 标 以 真品 出 售 。 假 设 伪装 成 本 为 ,真品 价格 为 p。 如 上 文 提 
及 ,这 是 一 个 不 完美 信息 博弈 : 在 买卖 双方 的 交易 中 .卖家 知道 自己 的 商品 是 否 为 尾 品 ， 
而 买 家 却 不 知道 。 买 卖 双方 的 博弈 可 用 图 4-9 的 扩展 型 表示 。 

若 古 币 是 真品 且 买 卖 成 交 , 则 卖家 和 买 家 的 得 益 分 别 为 p,v 一 p。 若 古 币 是 寿 品 且 
买卖 成 交 , 则 卖家 和 买 家 的 得 益 分 别 为 p 一 c,vri 一 pp。 否则 ,车 有 任何 一 方 不 同意 则 无 法 
成 交 , 双 方 的 得 益 都 为 0 一 一 除了 一 种 情况 : 卖家 出 售 履 品 但 买 家 不 买 时 卖家 损失 c。 

显然 ,有 2>c>0 ,否则 商人 将 没有 动机 仿冒 。 若 买 家 淘 到 了 真品 , 自 是 觉得 赚 了 一 
笔 ; 若 买 到 夺 品 , 则 上 顿 觉 不 值 。 这 意味 着 : wm 之 训 >w 二 0。 只 有 如 此 ,双方 才 有 参与 的 动 
机 ,形成 活跃 的 市 场 。 在 这 种 条 件 下 ,无 论 谁 单方 面 选择 积极 策略 ( 亦 即 卖家 始终 选择 卖 
或 买 家 始终 选择 买 ) 对 自身 都 有 一 定 的 风险 ,而 选择 保守 策略 ( 亦 即 卖家 始终 选择 不 卖 或 
买 家 始终 选择 不 买 ) 又 有 可 能 丧失 潜在 的 获 利 机 会 。 不 难 理解 ,该 博弈 如 果 存 在 策略 均 
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自然 


(pup) (00) (pevrp) (=c,0) 
图 4-9 旧 货 市 场 买卖 博弈 


衡 , 那 么 它 应 是 完美 贝 叶 斯 均衡 。 接 下 来 的 工作 便 是 求解 完美 贝 叶 斯 均衡 , 亦 即 结合 买 家 
的 信念 ,对 给 定 的 策略 组 合 进行 分 析 ,检验 它 是 否 满足 完美 贝 叶 斯 均衡 的 4 个 要 求 。 不 过 
在 此 之 前 , 先 介绍 4 种 市 场 类 型 。 

1. 4 种 市 场 类 型 

为 给 多 个 均衡 做 铺垫 ,我 们 先 介绍 4 种 市 场 类 型 ,实际 上 也 是 导致 不 同 均衡 的 代表 性 
条 件 。 它 们 是 : 市 场 完全 成 功 、 市 场 部 分 成 功 \ 市 场 接近 失败 和 市 场 完全 失败 。 

(1) 市 场 完全 成 功 。 此 种 情形 能 够 充分 实现 市 场 的 效率 ,在 不 损失 任何 一 方 利益 的 
前 提 下 总 体 利润 最 大 化 。 它 要 求 只 有 拥有 真品 的 卖家 将 * 古 币 ? 放 人 和 人 市场, 而 拥有 民品 的 
卖家 不 会 将 "上古 币 ” 放 入 市 场 。 由 于 市 场所 有 的 古 币 都 是 真品 , 买 家 始终 选择 买 下 。 此 时 
市 场 中 的 所 有 交易 都 为 优质 交易 ,因此 市 场 获得 最 大 的 总 体 利润 。 我 们 称 这 种 情况 为 “市 
场 完 全 成 功 ”。 

(2) 市 场 部 分 成 功 。 此 种 情形 能 获得 仅 次 于 类 型 (1 ) 的 市 场 总 利润 。 它 要 求 所 有 真 
品 卖家 将 “ 古 币 ? 放 和 市场, 同时 所 有 硕 品 卖家 也 都 会 将 所 谓 的 “ 古 币 ? 放 和 人 市场。 而 买 家 
的 决定 仍然 是 始终 买 下 。 买 卖 厦 品 的 交易 被 称 作 不 良 交 易 。 不 良 交 易 中 的 买 家 将 蒙受 损 
失 ,市 场所 获得 的 利润 将 低 于 类 型 (1)。 此 时 市 场 上 同时 存在 优质 交易 和 不 良 交 易 , 因 此 
市 场 能 够 获得 较 大 的 贸易 利润 。 我 们 称 这 种 情况 为 “市 场 部 分 成 功 ”。 

(3) 市 场 接近 失败 。 此 种 情形 所 获得 的 市 场 总 利润 比 类 型 (2) 的 还 要 低 。 它 要 求 所 
有 真品 的 卖家 将 “ 古 币 ” 放 入 市 场 ,同时 拥有 次 昼 品 的 卖家 将 “ 古 币 ” 以 一 定 的 概率 (大 于 
0, 小 于 100%) 放 入 市 场 。 买 家 则 以 一 定 的 概率 买 进 市 场 上 的 “ 古 币 ”此 时 市 场 上 同时 
存在 优质 交易 和 不 良 交 易 , 买 家 和 卖家 都 使 用 混合 策略 。 由 于 买 家 以 混合 策略 买 下 “证 
币 ”, 市 场 上 的 总 体 成 交 量 将 会 减少 ,因此 市 场 贸易 利润 将 比 类 型 (1) 和 类 型 (2) 的 都 要 低 。 
我 们 称 这 种 情况 为 “市场 接 近 失 败 ”。“ 市 场 接近 失败 ”容易 转化 为 接 下 来 的 “市 场 完 全 失 

(4) 市 场 完 全 失败 。 此 种 情形 所 获得 的 市 场 总 利润 最 小 。 由 于 担心 “ 古 币 ” 卖 不 出 
去 ,市 场 上 所 有 的 卖家 都 不 敢 将 “ 古 币 ”投放 市 场 , 买 家 自然 也 无 法 获得 “ 古 币 ”。 市 场 内 没 
有 交易 发 生 , 因 而 也 无 法 获得 市 场 贸易 利润 ,市 场 将 无 以 为 继 。 我们 称 这 种 情形 为 “市 场 
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完全 失败 ”。 
虽然 这 4 种 市 场 类 型 之 间 存 在 明显 的 界限 ,但 它们 相互 之 间 也 可 以 进行 转换 。 图 4-10 
可 直观 地 表现 出 4 者 之 间 的 区 别 和 联系 。 
(Ve—P)XP(g|A)+ Vo —P)XPb|A) 


| 纯 策 略 
市 场 部 分 成 功 | cp 
M 
混 FRR 
市 场 部 分 失败 合 市 场 完 全 成 功 
0 策 p 
略 
纯 策 略 
市 场 完全 成 功 


图 4-10 市 场 交易 的 4 种 类 型 及 其 关系 
图 中 M 代表 市 场 均衡 类 型 

令 1:““ 古 币 ” 为 真品 ”; /:““ 古 币 ” 为 履 品 ”; s:“ 卖 家 出 售 “ 古 币 ””。 则 P() 表 示 
“ 古 币 ” 为 真品 的 概率 ,P( 几 表示 “ 古 币 ” 为 寿 品 的 概率 ,P(s) 表 示 卖 家 出 售 “ 古 币 ” 的 概率 ， 
P(t|s) 表 示 当 卖家 出 售 “ 古 币 ” 时 “ 古 币 ” 为 真 的 概率 ,P(f|s) 表 示 当 卖家 出 售 “ 古 币 ” 时 
“ 古 币 ”为 假 的 概率 ,P(s14) 表 示 当 “ 古 币 ”为 真品 时 卖家 出 售 的 概率 ,P(s|/) 表 示 当 “ 古 
币 ” 是 帮 品 时 卖家 出 售 的 概率 。 

在 图 4-10 中 , 横 轴 为 卖家 的 伪装 成 本 c, 纵 轴 表 示 买 家 对 市 场 上 “ 古 币 ” 交 易 的 期 望 
得 益 E, 即 PC41s) (vt 一 p) 十 PC(f1s) (vt 一 p)。 使 用 c==p 和 EE=0 两 条 直线 将 整个 平面 划 
分 为 4 个 部 分 ,并 用 是 否 “ 有 利 可 图 ?来 判别 , 即 判别 期 望 得 益 是 否 大 于 0。 

(1) 如 果 策 略 组 合 ( 卖 出 , 买 人 ) 是 一 定 有 利 可 图 的 ,那么 卖家 / 买 家 一 定 会 进行 交易 ， 
选择 策略 为 纯 策 略 。 

(2) 如 果 策 略 组 合 ( 卖 出 , 买 人 ) 是 一 定 无 利 可 图 的 ,那么 卖家 / 买 家 一 定 不 会 进行 交 
易 ,选择 策略 为 纯 策 略 。 

(3) 如 果 策 略 组 合 ( 卖 出 , 买 人 ) 不 一 定 有 利 可 图 ,那么 卖家 / 买 家 会 以 一 定 的 概率 进 
行 交 易 ,选择 策略 为 混合 策略 。 

为 了 解 市 场 互相 转换 的 原理 ,不 妨 在 横 轴 的 上 方 绘制 一 点 M, 代 表 此 时 市 场 的 状态 ， 
同时 将 价格 p 在 图 中 用 一 条 纵 线 标 出 ( 注 : 在 图 中 p 是 不 变量 )。 

假设 一 开始 M 点 处 于 市 场 部 分 成 功 处 。 显 然 , 此 时 的 c 二 p,e0。 这 意味 着 伪装 成 
本 较 低 , 收 购 寿 品 出 售 是 有 利 可 图 的 。 同 时 . 卖 出 真 “上 古 币 ” 也 是 有 利 可 图 的 。 因 此 ,古董 
商人 会 将 所 有 的 “ 古 币 ”都 放 和 市场。 当然, 这 基于 卖家 对 买 家 策略 的 预测 : 他 全 都 买 下 。 
实际 上 , 买 家 的 策略 的 确 如 此 。 此 时 , 买 家 的 期 望 得 益 应 该 满足 e 二 P(t|s)X (Gv 一 p) 十 
P(f1s)X(vt 一 2) 放 0, 意 即 买 家 有 利 可 图 。 这 是 市 场 部 分 成 功 时 的 情况 。 

假如 伪装 成 本 c 逐渐 增 大 , 即 M 点 水 平 右 移 。 当 c 宇 p 时 ,转换 为 市 场 完 全 成 功 。 因 
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为 伪装 成 本 非常 高 , 厢 品 以 价格 p 出 售 无 利 可 图 ,因此 卖家 再 无 动机 伪装 。 市 场 上 流通 
的 “十 币 ?都 是 真品 , 厢 品 退出 市 场 。 注 意 , 买 家 的 信念 也 应 与 双方 策略 一 致 , 即 P(1|s) 王 
1,PCFls) 一 0。 显 然 , 买 家 的 期 望 得 益 为 正 , 买 家 一 定 买 人 * 古 币 *。 这 是 市 场 完全 成 功 时 
的 情况 。 

再 回 到 M 点 。 当 市 场 部 分 成 功 时 , 买 家 的 预期 得 益 显 然 低 于 购买 真品 时 的 预期 。 一 
般 而 言 , 在 封闭 市 场 内 双方 都 不 愿 打破 这 种 均衡 。 但 是 在 开放 市 场 内 ,常常 存在 尾 品 涌 
入 ,真品 异 售 ,这 些 将 会 改变 买 家 的 信念 ,进而 降低 买 家 的 期 望 得 益 。 所 以 , 当 买 家 的 期 望 
得 益 足 够 低 直 至 为 0 时 ,他 将 采取 混合 策略 。 对 于 卖家 ,所 有 真品 都 会 被 投入 市 场 ; 而 压 
品 则 有 卖 不 出 的 可 能 ,因此 插 品 也 会 以 混合 策略 投入 市 场 。 这 是 市 场 接近 失败 的 情况 ,而 
市 场 接近 失败 很 容易 转换 成 为 市 场 完 全 失败 ,转换 原理 详 见 4. 3. 2 节 扩 展 阅 读 。 当 市 场 
处 于 完全 失败 时 ,双方 均 无 利 可 图 ,市场 停滞 。 此 时 M 点 移 至 最 下 方 的 箭头 处 。 

2. 3 类 均衡 

回 看 4 种 市 场 类 型 ,显然 第 一 种 情形 更 利于 买 家 判断 的 形成 ,其 余 情 形 都 令 买 家 猜 不 
透 。 即 便 如 此 ,类 型 (2)、(3)、(4) 之 间 也 有 不 同 。 为 了 对 4 种 市 场 类 型 的 均衡 有 所 区 别 ， 
现 引入 3 类 均衡 : 分 离 均衡 、 合 并 均衡 和 混同 均衡 。 

(1) 分 离 均衡 。 不 同类 型 的 完美 信息 参与 者 (此 例 指 古 币 的 卖家 ,下 同 ) 采 取 完 全 不 
同行 动 的 市 场 均衡 , 称 为 分离 均 衡 ”。 分 离 均衡 可 以 出 现在 市 场 完全 成 功 模型 中 。 在 分 
离 均衡 下 ,卖家 将 会 以 " 古 币 ”的 质量 作为 区 分 , 厢 品 不 投入 市 场 , 真 品 投入 市 场 。 此 时 买 
家 很 容易 通过 卖家 的 行为 将 它们 区 别 开 来 。 

(2) 合并 均衡 。 不 同类 型 的 完美 信息 参与 者 采取 完全 相同 行动 的 市 场 均 衔 , 称 为 " 合 
并 均衡 >。 在 合并 均衡 下 , 买 家 完全 无 法 区 别 卖家 的 真实 信息 ,因此 可 忽略 卖家 的 行动 , 直 
接 从 市 场 的 基本 情况 中 寻找 行动 的 依据 。 

(3) 混同 均衡 。 不 同类 型 的 完美 信息 参与 者 采取 混合 策略 的 市 场 均衡 , 称 为 “混同 均 
衡 "。 在 混同 均衡 下 ,不 同类 型 卖家 的 行动 既 不 是 全 部 相同 ,也 不 是 全 部 不 同 ,而 是 既 有 相 
同 也 有 不 同 。 因 此 买 家 无 法 通过 卖家 的 行动 将 其 分 开 , 也 无 法 视 作 一 类 ,因此 , 买 家 只 能 
依靠 概率 分 布 来 判断 。 


(生生 主 详 : 3 类 的 街 的 通俗 名 


假设 世界 上 的 人 分 为 好 人 和 坏人 两 种 ,事情 也 分 好 事 和 坏事 。 但 是 一 个 人 是 好 人 还 
是 坏人 ,这 是 他 的 私有 信息 ,人 们 不 知道 。 但 是 ,人 们 可 以 通过 观察 他 做 了 好 事 还 是 坏事 ， 
来 判断 这 个 人 是 好 人 还 是 坏人 。 

假如 好 人 只 做 好 事 , 坏 人 只 做 坏事 ,不 同类 型 的 人 无 法 模仿 对 方 的 行为 。 好 人 要 模仿 
坏人 ,就 必须 做 坏事 ,但 是 他 做 坏事 的 心理 成 本 太 高 ,他 也 就 模仿 不 了 坏人 人。 同样 地 ,坏人 
想 模仿 好 人 ,就 必须 做 好 事 , 但 是 他 做 好 事 简直 是 折磨 ,所 以 他 也 模仿 不 了 好 人 。 结 果 , 外 
界 就 能 从 他 们 所 做 的 事情 来 推断 他 们 的 类 型 。 无 论 是 做 好 事 还 是 做 坏事 ,都 传递 了 参与 
者 类 型 的 有 效 信号 ,这 种 情况 被 称 为 分 离 均衡 。 如 图 4-11(a) 所 示 。 

然而 ,在 现实 生活 中 ,这 种 完全 的 信号 并 不 多 ,更 多 时 候 信号 只 是 部 分 有 效 。 比 如 ,在 
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同一 个 例子 中 ,好 人 做 坏事 的 心理 代价 很 高 ,所 以 好 人 都 不 做 坏事 ; 但 是 ,坏人 在 某 些 时 
候 做 好 事 的 代价 却 很 低 , 所 以 他 也 可 能 会 做 一 些 好 事 。 这 时 ,通过 观察 到 某 个 人 的 行为 ， 
我 们 得 到 的 结论 是 : 如 果 观 察 到 一 个 人 做 好 事 , 我 们 不 能 肯定 他 是 好 人 ; 但 是 如 果 观 察 
到 一 个 人 做 坏事 ,我 们 可 以 肯定 他 是 坏人 。 此 时 ,做 好 事 并 没有 传递 有 效 的 信号 ,而 做 坏 
事 则 传递 了 有 效 的 信号 ,这 种 情况 被 称 为 半分 离 均 衡 或 半 合 并 均衡 。 如 图 4-11(b) 所 示 。 

当然 ,也 存在 这 样 的 情况 ,无 论 好 人 坏人 ,他 们 都 既 做 好 事 又 做 坏事 。 这 时 做 好 事 或 
做 坏事 就 都 不 能 成 为 有 效 信号 。 这 种 情况 被 称 为 混同 均衡 。 此 时 ,观察 到 一 个 人 做 好 事 
或 做 坏事 ,或 许可 以 有 助 于 人 们 改善 关于 一 个 人 属于 好 人 或 坏人 的 信念 ,但 并 不 能 借 此 推 
断 出 其 类 型 。 如 图 4-11(c) 所 示 。 

还 有 大 家 都 做 好 事 ,或 者 大 家 都 做 坏事 的 情况 ,这 是 合并 均衡 。 此 时 观察 到 好 事 或 坏 
事 将 得 不 到 任何 的 进一步 信息 。 如 图 4-11(d) 所 示 。 


好 人 好 事 好 人 [一 呈 | 好 事 
坏人 | | 坏事 坏人 | 坏事 | 
(a) 分 离 均衡 (b) 半分 离 均衡 
好 人 光 好 事 好 人 | 一 二 | 好 事 

坏人 坏事 坏人 | 
(©) 混同 均衡 (d) 台 并 均衡 


图 4-11 3 类 均衡 的 关系 


3. 古玩 旧 货 市 场 的 均衡 

根据 上 述 4 种 市 场 类 型 和 3 类 均衡 的 定义 ,本 节 讨 论 * 古 币 ? 市 场 中 的 完美 贝 叶 斯 
均衡 。 

(1) 市 场 完全 成 功 (存在 条 件 : c< 宇 p)。 此 时 存在 一 个 纯 策略 的 分 离 均衡 : 

@ 真品 卖家 选择 出 售 , 虱 品 卖家 放弃 出 售 。 

@ 买 家 始终 买 人 “十 币 ”。 

@ 买 家 的 信念 为 P(t|s)=1,P(f|s)==0。 

分 析 : 在 检验 上 述 策略 组 合 时 ,只 需 验 证 它 是 否 满足 要 求 2 和 要 求 3 即 可 。 给 定 买 
家 的 信念 ,他 选择 买 的 期 望 得 益 为 (vt 一 p)X1 十 (vi 一 p)X0==vt 一 p 之 0。 不 买 则 得 益 为 
0, 所 以 买 家 一 定 买 人 。 首 推 至 卖家 ,他 对 “ 古 币 ”是 否 为 真 拥 有 完全 信息 。 当 “ 古 币 ” 为 真 
品 时 ,他 出 售 时 得 益 为 之 0, 所 以 选择 出 售 ; 当 * 古 币 ? 为 性 品 时 ,他 出 售 时 得 益 为 p 一 0， 
所 以 选择 不 卖 。 这 与 双方 的 策略 一 致 。 显 然 ,根据 买卖 双方 的 策略 可 知 P(s|2) 王 1， 
P(s| 户 王 0, 则 在 贝 叶 斯 法 则 下 买 家 的 信念 为 PCils) 王 PCD)PC|DOVLPGDOPC DO 十 PCP) 
P(s| 有 )]==1,P(f1s)==1 一 P(4|s) 二 0 与 策略 组 合 中 的 信念 一 致 。 所 以 买 家 推断 只 要 市 
场 上 出 售 的 “ 古 币 ”都 是 真品 ,显然 这 是 一 个 分 离 均衡 。 
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(2) 市 场 部 分 成 功 [ 存 在 条 件 : p 二 c,P( 六 充分 小 ]。 此 时 存在 一 个 纯 策 略 的 合并 
均衡 ， 

Q@ 无 论 * 古 币 ? 是 真 假 , 卖 家 均 出 售 。 

@ 卖家 始终 买 下 “ 古 币 ”。 

@ 买 家 的 信念 为 P(t|s)==P(7),P(f|s)==P(f)。 

分 析 : 当 买 家 选择 时 , 选 买 的 期 望 得 益 为 (vt 一 p)XP(1s) 十 (vi 一 p)XP(f|s)。 根 
据 先前 假设 ,P(/) 充 分 小 , 即 履 品 比 例 足 够 小 。 此 时 (vt 一 p)XP(D+(v 一 pp)XP( 由 二 
0, 买 家 始终 选择 买 下 。 回 推 至 卖家 ,真品 卖家 的 得 益 为 p. 尾 品 卖家 的 得 益 为 p 一 c, 二 
者 均 大 于 0。 因 此 无 论 真品 还 是 厢 品 的 卖家 都 会 选择 出 售 。 同 时 根据 双方 的 策略 可 知 
P(s|)= 二 1,P(s|/)= 二 1。 根据 贝 叶 斯 法 则 可 知 P(Gils) 王 PCOPGC1OVLPCDOPCs1i) 十 
P(f)P(s| 有]=P(),P(f1s)=1 一 P(t|s)==P(f), 这 与 买 家 的 信念 一 致 。 

(3) 市 场 完 全 失败 [Lp>c,P(O) 充 分 小 时 ]。 此 时 存在 一 个 纯 策 略 的 合并 均衡 ， 

O@ 无 论 真品 还 是 厢 品 的 卖家 都 选择 不 卖 。 

@ 买 家 始终 不 买 。 

@ 买 家 的 信念 为 P(t|s)==0,P(f|s)=1。 

分 析 : 当 买 家 行动 时 , 买 家 选 买 下 时 的 期 望 得 益 为 (vt 一 p)X0 十 (vr 一 p)X1<0, 因 
此 买 家 选择 不 买 。 至 于 卖家 ,真品 出 售 时 的 得 益 为 0; 厢 品 出 售 时 的 得 益 为 一 c, 所 以 卖家 
选择 不 卖 。 这 与 卖家 的 策略 一 致 。 同 时 ,根据 双方 的 策略 可 知 PC(s14) 二 0,P(s|/) 二 0。 
根据 贝 叶 斯 法 则 可 知 PCily)= 王 PCD)P(Cs1OoVLPCODPC OO 二 PCPPG AP]=0,PCFls) 王 
1 一 P(t|s) 二 1, 这 与 买 家 的 信念 一 致 。 实 际 上 ,由 于 P(1|s) 二 0, 它 意味 着 市 场 上 真品 的 
概率 为 0, 因 此 “真品 出 售 , 买 家 不 买 " 不 在 均衡 路 径 上 。 但 是 它 可 以 被 这 样 理解 : 它 是 在 
P() 充 分 小 时 的 极端 结果 , 买 家 推断 只 要 是 出 售 的 “ 古 币 ” 就 一 定 是 履 品 。 假 如 卖家 由 于 
失误 进入 了 市 场 ,由 于 真品 的 可 能 性 足够 小 ,因此 买 家 的 极端 推断 就 是 P(1|s) 二 0, 因 而 
选择 不 买 是 可 能 的 均衡 策略 。 所 以 该 均衡 满足 要 求 2 一 4。 

(4) 市 场 接近 失败 (存在 条 件 : bp>c,e=0) 。 此 时 存在 一 个 混合 策略 所 构成 的 混合 均 
衡 。 为 使 讨论 简便 ,我 们 使 用 数值 例子 来 说 明 。 假 设 w 王 3 万 元 ,vi 二 0 万 元 ,p 二 2 万 元 ， 
c 二 1 万 元 。 市场 上 真品 和 许 品 各 占 一 半 , 即 P(1) 二 P(f) 二 0.5。 此 时 的 混合 均衡 应 为 

Q@ 车“ 古 币 ”是 真品 ,卖家 始终 出 售 ,若是 虱 品 ,以 50% 的 概率 出 售 。 

@ 买 家 以 50% 的 概率 选择 买 下 。 

@ 买 家 对 市 场 的 判断 为 P(t1s) 二 2/3,P(f|s) 二 1/3。 

分 析 : 根据 双方 的 策略 可 知 PCs11)==1.P(s|/)==0.5。 由 贝 叶 斯 法 则 , 买 家 在 看 到 
卖家 的 出 售 时 对 “ 古 币 是 真品 ”的 后 验 判 断 为 

p(t) xX p(s/0) 

p(t) Xpls/D) pF X pls/f) 


二 0.5X1 
8 二 人 5059 


所 以 ,PCGils) 王 2/3,P(CFls) 王 1 一 PCils) 一 1/3 ,与 买 家 的 信念 一 致 。 


p(t/s) 


= 2/3 
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课堂 练习 : 请 根据 上 述 市 场 接近 失败 时 的 数值 例子 ,证 明 所 给 出 的 混合 策略 均衡 满 
足 序 列 理性 要 求 。 

不 难得 出 结论 ,在 买 家 尚未 对 卖家 完全 表 失 信心 的 市 场 里 (接近 失败 市 场 ) ,伪装 成 本 
无 疑 成 为 决定 市 场 走 向 的 中 流 厂 柱 : 伪装 成 本 越 高 , 越 容易 传递 自身 的 信息 ,真品 的 卖家 
和 硒 品 的 卖家 具有 完全 不 同 的 行为 , 买 家 一 眼 便 识 ; 伪装 成 本 越 低 , 越 难 传递 自身 的 信 
息 ,市 场 内 真 伪 难 辨 ,反倒 是 具有 真品 的 卖家 被 厦 品 的 暴利 挤 出 市 场 。 所 以 ,从 市 场 管理 
的 角度 考虑 ,我 们 应 提高 低 品质 商家 的 伪装 门槛 ,加 强 监 管 的 力度 , 别 让 “卑鄙 成 为 卑 却 者 
的 通行 证 ,高 尚 成 为 高 尚 者 的 墓志 铭 ”。 


4.3.2 双 价 市 场 模型 


基于 上 一 节 讨论 的 单一 价格 “ 古 币 ”交易 ,本 节 介 绍 稍微 复杂 的 双 价 交易 。 在 单一 价 
格 交易 中 ,卖家 只 有 两 个 选择 : 卖 或 者 不 卖 。 事实 上 ,卖家 可 以 有 多 个 定价 。 而 双 价 交易 
便 是 指 卖 家 可 自己 为 “ 古 币 ” 标 高 价 或 低 价 的 交易 。 在 单一 价格 交易 的 基础 上 , 双 价 交易 
做 了 部 分 添加 和 修改 。 

(1) 卖家 的 可 能 行动 是 标 “ 高 价 ” 和 *“ 低 价 ”。 

(2) 真品 可 以 标高 价 或 者 标 低 价 。 

(3) 履 品 可 以 标 低 价 , 也 可 以 伪装 后 标高 价 。 

事实 上 ,二 价 交 易 市 场 排除 了 不 准备 出 售 “ 古 币 ” 的 卖家 ,这 样 所 有 的 卖家 在 市 场 上 都 
是 可 见 的 ,更 利于 分 析 不 同 均衡 之 间 的 转换 。 常 言 道 :“ 一 分 价钱 一 分 货 .” 意 即 商 品质 量 
的 好 坏 取决 于 商品 价格 的 高 低 。 实 际 上 它 隐 含 了 一 种 假设 : 市 场 能 够 通过 价格 分 离 不 同 质 
量 的 商品 。 这 显然 是 分 离 均衡 的 结果 ,但 是 在 合并 均衡 或 混合 均衡 下 ,这 句 话 还 有 意义 吗 ? 

同上 文 ,真品 和 厢 品 对 买 家 的 价值 分 别 为 we 和 vi, 履 品 的 伪装 成 本 依然 为 c<。 高 价 和 
低 价 分 别 记 作 ph 和 pl。 显然 , 需 满足 w 二 wf\ 加 二 名.c 壹 0。 仿照 图 4-7, 双 价 交易 的 扩 
展 式 如 图 4-12 所 示 。 


自然 


prop) 00) rearp Ce0 pevp) (O00 rearp) (00) 
图 4-12 双 价 交易 的 扩展 式 


结合 实际 情况 ,做 如 下 假设 。 
假设 1: 对 于 买 家 而 言 ,真品 的 价值 大 于 卖家 所 出 的 高 价 . 虱 品 的 价值 介 于 高 价 和 低 
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价 之 间 , 即 vt 二 pn、ph 记 vt 记 1。 
假设 2: 买 家 更 倾向 于 用 高 价 买 真 品 ,而 不 是 用 低 价 买 帮 品 , 即 vt 一 ph 这 vi 一 也 1。 
此 外 ,变量 还 需 满足 如 下 关系 : 
v—ph>v—p>0>v—ph 
这 与 实际 观察 是 基本 一 致 的 : 对 买 家 而 言 即使 真品 价 高 也 是 值得 的 , 优 于 虱 品 价 低 。 

在 单一 价格 交易 中 , 低 品质 产品 向 高 品质 产品 的 伪装 费用 (伪装 成 本 c) 扮 演 了 相当 
重要 的 角色 。 双 价 交 易 亦 然 。 因 此 依据 成 本 变化 可 考虑 三 种 情形 : c==0,0<c<ph 一 1， 
和 c 放 pp 一 p13 种 情况 。 

(1) 当 c=0 时 。c=0 代表 着 履 品 伪装 成 本 非常 低 , 几 乎 为 0。 此 时 所 有 履 品 都 会 冒 
充 真品 ,并 标 以 高 价 ,同时 真品 也 是 标高 价 。 当 然 ,这 建立 在 一 种 信念 上 : 买 家 认为 低 价 
一 定 是 厦 品 。 因 此 ,依据 买 家 的 期 望 得 益 e 是 大 于 0、 等 于 0 或 小 于 0, 可 判断 市 场 是 部 分 
成 功 、 部 分 失败 或 完全 失败 的 。 

(2) 当 c 二 ph 一 pi 时。 由 于 伪装 费用 已 经 超过 标高 价 的 增益 ,因此 腹 品 将 不 青 冒充 
真品 ,同时 标 以 低 价 。 但 是 c 大 小 对 拥有 真品 的 卖家 并 无 影响 ,真品 仍 将 标 以 高 价 。 而 买 
家 完全 可 通过 价格 区 分 “ 古 币 ” 的 真 伪 : 高 价 者 真品 , 低 价 者 厢 品 。 买 家 的 选择 是 买 人 。 
因此 ,这 是 一 个 分 离 均衡 ,市场 处 于 完全 成 功 的 类 型 。 

(3) 当 0<c<ps 一 Pl 时 。 相 对 于 前 两 种 情况 ,这 种 情况 最 为 常见 。 在 单一 价格 交易 
中 曾 讨论 过 类 似 情 形 。 由 于 将 厢 品 伪装 后 既 有 可 能 卖 不 出 去 而 亏本 ,又 有 可 能 高 价 卖 出 
而 租 利 。 所 以 只 有 部 分 拥有 履 品 的 卖家 愿意 伪装 。 此 时 ,市 场 中 将 同时 存在 以 品 和 真品 ， 
买 家 必须 根据 对 方 的 策略 (取决 于 得 益 和 乙方 策略 等 )、 信 念 (对 真品 和 寿 品 比例 的 感知 ) 
及 贝 叶 斯 法 则 来 做 出 判断 。 此 时 市 场 既 有 可 能 是 部 分 成 功 的 .也 可 能 处 于 部 分 失败 或 完 
全 失败 的 类 型 ,而 均衡 则 是 合并 均衡 或 混同 均衡 。 

求解 双 价 交易 市 场 策略 均衡 的 常用 方法 是 逐步 试探 ,关键 是 找到 一 个 合理 的 策略 组 
合 ,然后 检验 其 是 否 满 足 完美 贝 叶 斯 均衡 的 4 个 要 求 。 实 际 上 ,对 于 一 般 的 不 完美 信息 博 
弈 ,信念 与 策略 之 间 的 相互 依赖 不 仅 使 得 均衡 解 不 再 唯一 ,也 大 大 增加 了 均衡 的 求解 难 
度 。 因 此 逐步 试探 是 简便 易学 的 方法 之 一 。 首 先 讨论 第 二 阶段 中 买 家 的 信念 ,接着 根据 
买 家 的 信念 来 确定 买 家 采取 何 种 策略 才 是 理性 的 ,然后 根据 买 家 所 采用 的 策略 ,讨论 第 一 
阶段 中 卖家 采用 哪 种 策略 是 可 信 的 ,最 后 得 出 该 模型 的 完美 贝 叶 斯 均衡 。 本 书 不 再 详 述 ， 
有 兴趣 的 读者 可 深入 阅读 更 多 书籍 。 

值得 注意 的 是 ,在 价格 可 变 时 不 完美 信息 对 市 场 的 破坏 作用 产生 了 新 的 表现 形式 。 
若 交易 价 格 可 变 ,卖家 为 了 出 清 将 允许 讨价还价 ,那么 理性 买 家 所 愿意 支付 的 最 高 价 将 不 
高 于 “ 古 币 ” 的 “期 望 价值 "[ 上 文 的 PGs) Xu 十 P(f1s)Xwvj, 并 以 此 逐渐 形成 市 场 从 
格 。 由 于 该 价格 低 于 真品 的 价值 ,真品 将 逐渐 退出 市 场 。 它 导致 真品 在 市 场 中 的 比例 下 
降 ,进一步 买 家 的 期 望 价值 降低 ,其 所 愿 支付 的 价格 也 将 更 低 , 又 再 度 把 真品 挤 出 市 场 。 
这 一 恶性 循环 的 最 终结 果 是 市 场 上 只 剩 下 低 品质 的 性 品 ,而 不 会 有 高 价值 的 真品 , 买 家 也 
不 再 愿意 购买 。 这 是 一 个 完全 失败 的 市 场 ,其 直接 原因 是 信息 不 完美 和 伪装 成 本 过 低 。 
换言之 ,由 于 参与 双方 信息 不 对 称 , 买 家 不 能 识别 商品 的 质量 ,因而 不 愿 付 高 价 购买 商品 ， 
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最 终 引 起 优质 品 逐 渐 被 劣质 品 赶 出 市 场 。 这 种 过 程 通常 被 称 为 “逆向 选择 ”, 这 样 的 市 场 
则 被 称 为 “柠檬 市 场 "%。 关 于 “逆向 选择 ”的 故事 ,下 一 节 将 继续 说 明 。 


4.4 浅说 信息 不 对 称 * 


< 引 语 放 事 : 大 额 保单 


大 额 保 单 曾 是 很 多 私人 银行 的 重要 产品 。 为 了 刺激 保单 的 销售 ,银行 往往 给 客户 经 
理 高 额 的 销售 提成 。 这 些 不 同类 型 的 大 额 保 单 对 于 客户 来 说 并 非 没有 帮助 ,比方 说 : 一 
个 30 多 岁 的 IT 新贵, 可 以 用 500 万 美元 的 保费 , 买 到 差不多 3 000 万 美元 身 故 赔偿 金 的 
大 额 保单 。 而 这 500 万 美元 的 保费 ,又 可 以 通过 银行 贷款 拿 到 差不多 70 中 。 也 就 是 说 ， 
他 可 能 只 需要 付 150 万 美元 的 保费 ,就 可 以 享受 到 3 000 万 美元 的 身 故 赔偿 金 。 如 此 高 
的 杠杆 率 , 而 又 不 需要 面 对 市 场 起 伏 的 风险 ,对 于 这 张 保单 的 受益 人 来 说 ,的 确 是 不 错 的 
选择 。 

一 年 前 ,客户 经 理 Sam Davis 曾 销售 给 某 一 客户 一 张 500 万 美元 的 大 额 寿险 保单 。 
该 客户 本 人 正 是 这 张 保 单 的 被 保险 人 ,而 持 有 人 亦 即 受益 人 是 他 的 妻子 。 但 是 这 周一 上 
班 , 他 就 看 到 这 个 客户 在 焦急 地 等 待 他 。Davis 永远 不 会 忘记 见面 时 客户 脸 上 的 丽 惧 。 
原来 ,这 位 客户 与 妻子 正 办 理 离婚 ,而 妻子 为 了 断绝 一 切 瓜 葛 就 将 这 张 保 单 转 给 了 他 的 拓 


客户 为 什么 会 充满 恐惧 ?有 些 读者 可 能 已 经 猜 到 了 。 大 额 寿 险 赔偿 金 的 偿付 条 件 是 
被 保险 人 的 死亡 。 因 此 , 当 保 险 公 司 兑付 这 3 000 万 美元 死亡 赔偿 金 的 时 候 , 那 个 被 保险 
的 人 已 经 不 存在 了 。 因 此 它 隐 含 着 极 大 的 风险 。 如 果 客 户 很 爱 自 己 的 妻子 和 孩子 ,又 确 
信 妻 子 很 爱 他 ,那么 他 就 可 以 买 这 样 一 份 大 额 保单 ,以 确保 在 自己 意外 死亡 后 她 们 衣食 无 
忧 。 但 是 客户 并 不 确信 自己 的 岳母 是 什么 想法 ,会 不 会 加 害 自 己 ,所 以 客户 才 有 了 深 深 的 
恺 惧 。 

这 种 信息 不 对 称 在 现实 中 比比 皆 是 。 例 如 ,在 雇佣 关系 中 ,雇员 的 能 力 、 品 德 等 信息 ， 
雇主 一 般 也 无 法 完全 知道 。 员 工 每 天 做 些 什么 .工作 是 否 尽心 尽力 ,老板 通常 也 不 完全 清 
楚 。 在 商业 借贷 中 ,对 于 借贷 人 的 诚信 和 度 、 项 目的 一 利 前 景 等 ,银行 也 并 不 完全 了 解 。 信 
贷 资金 的 使 用 是 否 符合 合同 规定 ,银行 也 不 可 能 完全 掌握 。 在 医 患 关系 中 ,医生 拥有 比 病 
人 更 多 的 有 关 病 理 、 医 药方 面 的 知识 。 医 生 开 给 患者 某 种 药 ,究竟 是 真 的 为 了 治 病 还 是 为 
了 拿 药 商 的 回扣 ,患者 不 容易 判断 。 总 之 ,只 要 有 信息 ,就 难免 有 信息 获取 程度 的 差异 , 生 
活 中 处 处 有 潜在 的 信息 不 对 称 。 

在 博弈 信息 类 型 中 存在 信息 完全 和 不 完全 信息 完美 和 不 完美 两 类 情况 。 在 这 些 博 
弈 中 ,完全 且 完 美 信息 博弈 的 参与 者 对 于 信息 的 获取 能 力 都 是 相同 的 ,这 被 称 为 “信息 对 


@ “和 柠檬 "在 美国 倡 语 中 表示 * 次 品 "或 “不 中 用 的 东西 "。 
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称 ”。 可 事实 并 非 完全 如 此 。 由 于 自然 因素 或 者 人 为 因素 ,参与 各 方 对 信息 的 了 解 是 有 差 
异 的 ,这 种 真实 信息 多 寡 不 一 致 的 现象 就 称 为 “信息 不 对 称 "”。 信 息 不 对 称 会 导致 掌握 信 
息 比 较 充 分 的 一 方 在 市 场 活动 中 常常 处 于 占 优 势 的 地 位 ; 而 掌握 信息 比较 荐 乏 的 一 方 则 
处 于 劣势 地 位 。 

“信息 不 对 称 理论 ?是 由 3 位 美国 经 济 学 家 一 一 约瑟夫 。 斯 蒂 格 利 茨 、 乔 治 。 阿 克 洛 
夫 和 迈克 尔 * 斯 宾 塞 提出 的 。 该 理论 认为 : 四 市 场 中 卖家 比 买 家 更 了 解 有 关 商 品 的 各 种 
真实 信息 ; 四 信息 较 多 的 一 方 可 以 通过 向 信息 较 少 的 一 方 传递 可 靠 信 息 而 在 市 场 中 获 
益 ; 加 买卖 双方 中 拥有 信息 较 少 的 一 方 会 努力 从 信息 较 多 的 一 方 获取 信息 。 阿 克 洛 夫 认 
为 市 场 上 卖家 之 所 以 能 向 买 家 推销 低 质 量 的 商品 ,就 是 因为 市 场 双方 各 自 所 掌握 的 信息 
不 对 称 。 斯 宾 塞 则 揭示 了 应 如 何 利用 所 掌握 的 信息 来 谋取 更 大 得 益 。 而 斯 带 格 利 茨 提出 
了 人 掌握 信息 较 少 的 一 方 应 如 何 进行 市 场 调整 的 理论 。 阿 克 劳 夫 、 斯 宾 塞 和 斯 蒂 格 利 茨 关 
于 “信息 不 对 称 ” 的 理论 用 途 广 泛 , 构 成 了 现代 信息 经 济 的 核心 。 它 不 仅 适用 于 对 传统 农 
业 市 场 的 分 析 , 也 适用 于 对 现代 金融 市 场 的 研究 。 

信息 不 对 称 将 会 造成 市 场 效率 低下 ,甚至 是 市 场 完全 失败 。 从 时 间 角 度 上 划分 ,不 对 
称 信息 可 以 表现 在 与 当事人 签约 (交易 ) 之 前 ,也 可 以 表现 在 签约 (交易 ) 之 后 。 这 两 种 情 
况 分 别 被 称 为 "事前 不 对 称 信息 ”和 ”事后 不 对 称 信息 ”。 一 般 而 言 ，“ 事 前 不 对 称 信息 ”所 
造成 的 结果 常 被 称 为 逆向 选择 ,而 “事后 不 对 称 信息 ”的 结果 则 被 称 为 道德 风险 。 


4.4.1 逆向 选择 


在 拍卖 市 场 中 ,尽管 参加 拍卖 的 商品 可 供 竞标 者 检查 ,但 是 拍卖 商 和 众多 竞标 者 所 能 
够 辨别 的 信息 却 不 尽 相 同 : 拍卖 商 深 知 拍卖 品 的 真实 价值 ,而 竞拍 者 可 能 无 法 完全 认 清 
拍卖 品 的 内 在 质量 。 例 如 ,在 二 手 车 拍卖 中 有 一 辆 待 拍卖 的 精致 跑车 存在 噪声 问题 。 竞 
拍 者 1 通过 试 加 发 现 了 噪声 的 来 源 ,知道 大 致 的 修理 成 本 ,那么 他 算 摸 清 了 车 的 底细 。 而 
竞拍 者 2 不 知 问题 所 在 ,他 只 得 赌 一 财运 气 : 好 运 的 话 是 低 价 淘 到 了 有 微小 问题 的 好 车 ， 
背 运 的 话 只 得 为 残 次 品 支 付 较 高 的 修理 费用 。 同 样 的 一 辆 跑车 ,不 同 竞拍 者 所 能 甄别 的 
信息 就 存在 着 差异 。 那 么 , 若 所 拍 车 辆 只 存在 微小 的 问题 ,只 有 了 解 车 辆 问题 的 竞拍 者 才 
会 更 准确 地 为 车 辆 定价 。 而 其 他 不 了 解 车 辆 问题 的 竞拍 者 就 会 给 出 错误 的 较 低 竞价 。 这 
样 可 能 会 导致 拍卖 商 对 拍卖 老 失 信心 ,进而 拥有 “良品 ”的 拍卖 商 逐 渐 退 出 拍卖 市 场 , 剩 下 
的 拍卖 品质 量 也 将 逐渐 下 降 。 下 面 通过 数值 例子 来 说 明 他 们 的 互动 结果 。 

假设 存在 这 样 一 个 二 手 汽车 市 场 ,有 100 人 希望 出 售 他 们 的 汽车 ,同时 又 有 100 人 想 
买 二 手 汽 车 。 买 主 和 卖主 都 知道 这 些 旧 汽车 中 高 质量 与 低 质 量 的 汽车 各 占 50%。 同 时 ， 
拥有 高 质量 和 低 质量 汽车 的 卖主 的 预期 售 价 分 别 为 2 000 美元 和 1 000 美元 ,而 潜在 买主 
的 预期 支付 则 分 别 为 2 400 美元 和 1 200 美元 。 

如 果 信 息 对 称 且 充分 ,买主 不 难 确定 二 手 汽车 的 质量 ,该 市 场 不 存在 什么 问题 。 低 质 
量 汽车 将 按 1 000~1 200 美元 的 价格 出 售 ,高 质量 汽车 将 按 2 000 一 2 400 美元 的 价格 
交易 。 

但 是 在 信息 不 对 称 时 ,买主 无 法 了 解 每 辆 汽车 的 质量 ,只 能 进行 推测 。 因 此 ,典型 的 
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买主 将 以 预期 值 购买 旧 汽 车 , 即 愿 意 支付 : 1/2X1 200 十 1/2X2 400 王 1 800( 美 元 ) 。 这 
样 ,拥有 高 质量 汽车 的 卖主 将 不 愿意 出 售 汽车 ,会 退出 市 场 。 

假定 高 质量 的 汽车 退出 市 场 后 ,二 手 汽车 市 场 上 高 质量 与 低 质量 汽车 的 比例 变 为 
2 : 3。 买 主 也 会 感觉 到 二 手 车 市 场 质量 分 布 的 变化 ,他 们 将 不 会 再 以 1 800 美元 作为 预 
期 价格 ,而 是 以 3/5X1 200 十 2/5X2 400 王 1 680( 美 元 ) 作 为 预期 价格 。 实 际 上 ,3/5 和 2/5 
即 是 买 家 的 信念 。 结 果 , 又 会 有 部 分 次 高 质量 的 二 手 汽车 退出 市 场 。 这 一 过 程 不 断 发 生 ， 
最 后 ,市 场 上 将 只 剩 下 最 低 质量 的 汽车 ,高 质量 汽车 被 排挤 出 市 场 。 如 图 4-13 所 示 。 


第 二 轮 选 择 后 的 质量 分 布 
第 一 轮 选 择 后 的 质量 分 布 


一 选择 前 质量 分 布 


图 4-13 ”二手 车 市 场 的 质量 变化 


细心 的 读者 可 能 会 发 现 , 上 述 例子 正 是 前 文中 双 价 交易 中 提 及 的 "逆向 选择 "现象 。 
在 市 场 上 “逆向 选择 "有 着 明确 的 定义 。 

定义 4.2 逆向 选择 是 指 由 于 市 场 上 交易 双方 信息 不 对 称 所 产生 的 市 场 流通 商品 质 
量 下 降 的 过 程 。 

1970 年 , 阿 克 洛 夫 发 表 了 论文 (柠檬 市 场 : 质量 不 确定 性 和 市 场 机 制 》。 阿 克 洛 夫 在 
这 篇 论文 中 提出 的 逆向 选择 理论 揭示 了 看 似 简 单 实际 上 又 非常 深刻 的 经 济 学 道理 : 道 向 
选择 问题 来 自 买 家 和 卖家 有 关 二 手 车 的 质量 信息 不 对 称 。 他 指出 ,信息 不 对 称 所 带 来 的 
最 后 结果 是 : 市 场 上 成 了 破烂 车 的 展览 馆 , 极 端的 情况 是 一 辆 车 都 不 成 交 。 而 当时 现实 
的 情况 是 ,社会 成 交 量 小 于 实际 均衡 量 。 但 是 ,就 美国 的 二 手 车 市 场 而 言 ,在 经 过 几 十 年 
的 发 展 后 ,现在 已 经 形成 规模 庞大 的 交易 系统 和 相对 高 效 的 交易 机 制 。 尽 管 在 二 手 车 市 
场 中 ,买卖 双方 的 信息 差异 不 断 缩小 ,但 信息 不 对 称 导 致 的 “逆向 选择 ” 仍 广 泛 地 存在 于 生 
活 的 方方面面 。 

在 保险 市 场 中 ,一 般 年 龄 超过 65 岁 的 人 买 不 到 保单 。65 岁 以 上 老人 的 定期 保费 很 
高 ,只 有 那些 最 悲观 (也 即 健康 状况 最 差 ) 的 投保 人 才 会 认为 这 样 的 保费 是 有 吸引 力 的 。 
我 们 不 妨 来 分 析 一 下 保险 公司 这 样 设 定 保费 背后 的 原因 。 保 险 市 场 内 存在 两 方 : 投保 人 
和 保险 商 。 投 保 人 比 保险 商 更 加 清楚 自身 的 健康 状况 ,其 中 存在 一 部 分 投保 人 还 会 主动 
隐瞒 自身 的 健康 状况 ,使 保险 公司 难以 获取 真实 信息 。 假 如 保险 商 无 法 有 效 甄 别 投保 人 
的 信息 ,而 是 采用 简单 粗暴 的 方法 。 例 如 ,对 于 所 有 投保 人 的 健康 状况 进行 一 次 平均 评估 
(而 不 是 单独 对 每 个 投保 人 评估 ) 以 设 定 风险 程度 ,那么 高 风险 人 群 (健康 状况 较 差 ) 倾 向 
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于 购买 保险 ,因为 购买 保险 可 能 使 自己 获得 可 观 的 保险 收入 ; 而 低 风险 人 群 (健康 状况 较 
好 ) 则 倾向 于 不 购买 保险 ,因为 即使 购买 了 保险 ,保险 赔付 概率 和 保险 赔付 力度 都 不 够 给 
力 。 结 果 ,保险 公司 将 会 面临 较 大 的 赔付 概率 ,甚至 导致 亏损 。 这 就 是 一 种 "逆向 选择 ”， 
投保 人 的 健康 状况 会 因为 保费 的 上 升 而 下 降 , 同 时 保费 也 会 由 于 投保 人 的 健康 状况 而 上 
升 一 一 最 后 市 场 上 将 不 会 存在 保险 交易 。 

在 发 行 市 场 中 ,这 种 信息 不 对 称 也 突出 体现 在 上 市 公司 与 投资 者 之 间 。 上 市 公司 期 
望 通过 新 股 上 市 来 筹措 资金 。 一 般 来 讲 , 上 市 公司 是 资金 的 具体 使 用 者 ,对 于 投资 项 目的 
未 来 收益 .风险 以 及 筹措 资金 的 运用 等 具有 内 部 信息 ,知道 公司 的 可 能 利润 。 而 投资 者 一 
般 不 参与 资金 的 使 用 ,只 能 通过 财务 报告 或 其 他 渠道 来 了 解 上 市 公司 的 经 营 状况 。 投 资 
者 所 掌握 的 信息 可 能 不 充分 ,也 不 准确 。 因 此 ,如 果 没 有 强制 性 信息 公开 的 要 求 ,上 市 公 
司 的 许多 信息 是 其 所 不 愿 披露 的 。 同 时 ,上 市 公司 总 是 倾向 揭示 于 己 有 利 的 信息 ,而 不 愿 
将 于 已 不 利 的 信息 准确 及时、 完整 地 披露 出 来 。 因 此 在 相关 信息 占有 方面 ,投资 者 处 于 
劣势 ,而 上 市 公司 居于 优势 。 投 资 者 不 能 对 上 市 公司 的 未 来 收益 和 风险 做 出 准确 判断 ,只 
能 根据 平均 质量 确定 上 市 公司 的 价值 。 如 此 一 来 ,优质 公司 股票 的 市 场 价值 将 被 低估 , 相 
反 , 劣 质 公 司 的 股票 价值 却 被 高 估 。 那 么 ,劣质 公司 更 有 积极 性 通过 股权 融资 来 扩大 经 营 
规模 。 显 然 ,信息 不 对 称 降低 了 证 券 发 行 市 场 对 资本 资源 优化 配置 的 功能 。 同 时 ,劣质 公 
司 在 最 大 限度 利用 股权 融资 时 可 能 会 积极 “粉饰 ”和 隐藏 自己 的 真实 信息 ,从 而 形成 "逆向 
选择 "。 在 极端 情况 下 ,交易 双方 将 无 法 从 事 交 易 。 


4.4.2 道德 风险 


曾 获 2001 年 度 诺 贝 尔 经 济 学 奖 的 斯 蒂 格 里 茨 在 研究 保险 市 场 时 ,发 现 了 一 个 有 趣 的 
现象 。 曾 经 有 几 位 美国 大 学 生 尝 试 过 为 校园 自行 车 开设 保险 ,然而 在 开设 保险 项 目 之 后 ， 
自行 车 丢失 率 反 而 上 升 了 不 少 , 从 原来 的 10% 上 升 到 15%。 究 其 原因 发 现 由 于 有 了 保 
险 ,车 主 的 防范 意识 会 下 降 。 因 为 车 主 自身 不 用 承担 全 部 风险 ,也 就 不 会 积极 防范 丢失 车 
子 , 因 此 提供 保险 方 就 会 面临 被 投保 人 转嫁 的 风险 。 投 保 人 在 投保 后 做 出 的 这 种 不 负责 
任 的 行为 所 造成 的 风险 ,被 称 为 “道德 风险 ”。 

同样 ,在 健康 保险 市 场 , 当 投 保 人 购买 了 全 额 保险 而 保险 公司 又 不 能 严格 监督 投保 人 
行为 的 情况 下 ,投保 人 可 能 会 乐于 参与 高 风险 的 行动 。 保 险 公司 可 以 通过 投保 人 在 签订 
保险 协议 前 ,调查 了 解 投保 人 的 历史 行为 来 确认 保险 条 款 ( 消 除 “逆向 选择 ”) ,但 是 却 不 能 
预测 签订 协议 后 投保 人 是 否 会 做 出 行为 改变 一 一 因为 信息 仍然 不 对 称 。 因 此 ,信息 不 对 
称 仍然 会 导致 市 场 出 问题 ; 道德 风险 。 

定义 4.3 在 信息 不 对 称 的 市 场 上 ,拥有 较 多 信息 的 一 方 利用 所 拥有 的 信息 增加 自 
身 利益 ,而 损害 其 他 信息 较 少 者 的 利益 的 风险 , 称 作 道德 风险 。 

此 时 ,拥有 较 多 信息 的 一 方 被 称 为 “风险 制造 者 ”拥有 较 少 信息 的 一 方 被 称 为 风险 
承担 者 ”。 道 德 风险 一 般 具 有 以 下 3 个 特征 。 

(1) 内 生性 特征 。 风 险 形 成 于 经 济 行为 者 对 利益 与 成 本 的 暗自 思量 , 即 源 于 行为 主 
体 之 间 的 互动 行为 。 
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(2) 牵引 性 特征 。 凡 是 风险 制造 者 ,都 存在 受到 利益 诱惑 而 以 逐 利 为 目的 的 特征 。 

(3) 损人 利己 特征 。 即 风险 制造 者 的 风险 收益 都 是 对 风险 承担 者 利益 的 不 当 搜 取 。 

道德 风险 是 基于 理性 人 假设 下 的 必然 现象 ,由 于 它 是 合乎 个 体 理性 的 ,因此 具有 普遍 
意义 。 
首先 ,在 市 场 交 易 中 , 除 了 保险 公司 与 投保 人 之 间 , 所 有 存在 委托 一 代理 关系 的 行为 
主体 之 间 都 可 能 演绎 出 “道德 风险 ”"。 那 么 ,什么 是 委托 一 代理 关系 呢 ? 通俗 地 说 ,如 果 某 
个 人 或 组 织 向 其 他 个 人 或 组 织 提出 一 项 “委托 ”, 以 便 完成 某 项 任务 或 工作 ,这 种 关系 即 为 
“委托 一 代理 关系 ”。 委 托 的 提出 者 通常 被 称 为 “委托 人 ”, 而 委托 承担 者 常 被 称 为 “代理 
人 ”。 在 这 样 的 关系 之 中 ,道德 风险 随处 可 见 。 例 如 ,在 人 们 购买 汽车 保险 后 ,不 会 像 以 前 
那样 细心 地 驾驶 汽车 ; 在 人 们 购买 火灾 保险 后 ,不 会 像 从 前 那样 谨慎 地 防范 火灾 ; 在 实 
行 公费 医疗 制度 以 后 ,药品 的 浪费 将 会 增加 。 换 言 之 ,只 要 代理 人 持 有 他 人 资产 或 被 赋予 
权力 ,他 就 有 着 天 然 的 动机 巧 取 豪 夺 或 消极 仍 工 : 正 如 亚当 ， 斯 密 在 他 的 著作 《国富 论 》 中 
的 描述 : 

“无 论 如 何 , 由 于 这 些 公司 的 董事 们 是 他 人 钱财 而 非 自己 钱财 的 管理 者 ,因此 ,很 难 想 
象 他 们 会 像 自己 照看 自己 的 钱财 一 样 的 警觉 ,所 以 ,在 这 类 公司 的 管理 中 , 玖 忽 和 浪费 总 
是 或 多 或 少 地 存在 。” 

其 次 ,在 日 常生 活 中 道德 风险 也 相当 普遍 。 正 所 谓 “ 被 偏爱 的 都 有 待 无妨", 如果 一 个 
小 孩 知道 在 他 超支 时 能 轻易 得 到 父母 追加 的 零花 钱 , 那 么 他 乱 花 钱 的 可 能 性 就 会 增加 。 
又 如 “人 人 生 而 平等 ,但 有 些 人 更 加 平等 ”, 如 果 某 个 政府 官员 的 亲属 认为 他 触犯 法 律 的 时 
候 会 得 到 该 官员 的 有 效 庇护 ,那么 他 遵守 法 律 的 自觉 性 将 会 下 降 。 再 如 “婚姻 是 爱情 的 坟 
幕 ”, 如 果 某 个 男人 认为 一 纸 婚 约 可 以 束缚 女人 的 一 生 ,那么 他 就 会 在 婚前 夸 下 海口 , 婚 后 
原形 毕露 。 道 德 风险 之 于 生活 ,就 要 看 生命 这 袭 原本 华丽 的 长 袍 里 面 有 没有 长 出 虱子。 

实际 上 ,只 要 存在 某 一 方 的 边际 成 本 小 于 边际 收益 ,而 这 种 信息 又 不 为 对 方 所 知 , 那 
么 “理性 人 ”就 会 为 了 获得 最 大 收益 ,不断 利 用 信息 不 对 称 “ 反 向 选择 “违背 道德 ”, 直 到 边 
际 成 本 等 于 边际 收益 为 止 。 


分 思考 与 练习 
同 为 信息 不 对 称 ,逆向 选择 与 道德 风险 的 主要 区 别 体现 在 哪些 方面 ? 


随 着 技术 进步 、 精 细 化 分 工 等 因素 进一步 造成 信息 不 对 称 下 的 逆向 选择 和 道德 风险 。 
比如 大 米 和 转基因 大 米 , 大 米 和 有 机 大 米 , 价 格 差距 很 大 且 普 通 消费 者 很 难 鉴别 的 经 济 
性 ; 手术 、 医 疗 .药物 等 专业 化 程度 极 高 的 行业 ,管理 咨询 等 更 加 难以 量化 的 行业 ,高 昂 的 
收费 背后 是 否 尽 勤勉 义务 ,复杂 结构 .华丽 设计 的 背后 究竟 是 否 存在 价值 也 犹 未 可 知 。 

我 们 能 够 做 的 就 是 不 断 投放 更 多 的 信息 ,在 市 场 化 体制 中 依靠 激励 相 容 来 增加 外 部 
约束 ,在 非 市 场 化 体制 中 加 强 监管 力度 和 强化 行业 自律 。 市场 化 下 的 解决 非 对 称 信 息 的 
市 场 机 制 , 如 靠 品牌 声誉 .口碑 等 ; 非 市 场 化 下 的 机 制 如 独立 第 三 方 有 有 机 产品 认证 机 
构 .行业 协会 管理 ,第 三 方 专业 咨询 机 构 、 行 政 下 的 行业 准 入 和 强制 抽检 内 容 标识 等 。 但 
第 三 方 机 构 会 不 会 由 于 信息 优势 产生 道德 风险 ,政府 机 构 是 否 有 专业 胜任 能 力 和 独立 性 


4 章 完全 但 不 完美 信息 博弈 155 


潞 


来 进行 监管 .潜在 的 在 寻 租 机制 失 效 等 衍生 问题 仍然 需要 解决 。 

实际 上 ,本 节 所 介绍 的 逆向 选择 和 道德 风险 并 不 限于 不 完美 信息 博弈 中 ,在 不 完全 信 
息 博 弈 中 也 广泛 存在 。 而 在 不 完全 信息 下 将 出 现 更 多 有 意思 的 话题 ,还 请 读者 继续 阅读 
本 书 第 5 章 。 


本 章 小 结 与 习题 


第 5 章 不 完全 信息 博弈 


言 息 ,信息 越 精确 越 好 。 但 是 决策 者 往往 无 法 获知 决策 所 需要 的 全 部 信息 ， 
而 是 仅 掌握 有 限 信息 。 例 如 ,在 开战 前 夕 交战 双方 不 能 悉 知 对 方 的 军事 实力 和 行动 计划 ; 
在 竞选 中 候选 者 不 能 确定 对 手 的 选民 支持 率 ; 在 购物 中 消费 者 无 法 断定 产品 质量 优 劣 ; 
在 恋爱 中 情侣 无 法 把 握 对 方 是 否 爱 自己 ,及 至 爱 自己 有 多 深 …… 总 之 ,自然 的 和 人 为 的 因 
素 所 带 来 的 不 确定 性 ,以 及 确定 但 难以 获取 的 私有 信息 ,使 得 几乎 所 有 的 决策 都 面临 着 信 
息 不 完全 的 困境 。 在 这 样 的 环境 中 ,人 们 应 该 如 何 形 成 自己 的 判断 ,又 该 如 何 决策 才能 显 
得 足够 理性 ? 

本 章 将 继续 围绕 信息 不 对 称 来 展开 讨论 ,重点 介绍 不 完全 信息 博弈 中 所 用 到 的 推理 
分 析 方法 ,同时 通过 实例 引领 读者 进入 不 完全 信息 理论 的 美妙 应 用 。 


前 几 章 所 介绍 的 情景 之 所 以 能 够 通过 浅 易 模 型 描述 ,一 个 重要 特征 是 : 对 所 有 参与 
者 而 言 博弈 是 “共同 知识 ”。 换 言 之 ,每 个 参与 者 都 知道 谁 是 博弈 参与 者 .各 自 的 策略 集 以 
及 每 个 策略 组 合 所 对 应 的 结果 ,因而 称 为 "完全 信息 博弈 ”。 接 下 来 本 书 将 介绍 不 完全 信 
息 博 弈 。 首 先 给 出 不 完全 信息 与 完全 信息 的 区 别 。 

如 果 每 个 参与 者 对 博弈 的 规则 、 其 他 参与 者 的 特征 和 得 益 等 要 素 都 是 事先 知晓 的 ， 
就 称 该 博弈 具有 完全 信息 ; 否则 ,该 博弈 具有 不 完全 信息 , 亦 称 不 完全 信息 博弈 。 特 别 
地 ,如 果 在 一 个 博弈 中 至 少 存在 一 个 参与 者 不 知道 其 他 参与 者 的 得 益 , 则 该 博弈 具有 不 完 
全 信息 @。 由 于 信息 不 完全 ,参与 者 对 博弈 中 相关 事件 发 生 可 能 性 大 小 的 推断 (信念 ) 是 
建立 在 贝 叶 斯 法 则 基础 上 的 ,因此 不 完全 信息 博 蛮 有 时 亦 称 作 * 贝 叶 斯 博弈 ”。 

但 对 于 多 数 情景 而 言 ,“ 共 同 知识 ”与 现实 之 间 尚 有 距离 。 在 此 ,我 们 必须 强调 博弈 的 
艺术 性 。 归 根 结 底 , 博 穿 论 中 的 模型 是 客观 现实 的 近似 ,任何 近似 都 与 现实 之 间 存 在 一 定 
距离 。 因 此 ,从 简单 模型 开始 ,大 多 数 的 理论 研究 都 着 眼 于 如 何 更 接近 现实 。 纵 观 科学 发 
展 史 ,任何 一 个 理论 的 形成 都 是 由 简 及 繁 、 逐 渐 成 形 的 一 一 博弈 论 也 是 如 此 。 在 纳什 均衡 
概念 建立 之 后 ,研究 逐渐 向 不 完全 信息 下 的 情形 扩展 。 

然而 ,正如 罗宾逊 夫人 所 言 ,“ 比 例 尺 是 1 : 1 的 地 图 是 没有 用 的 ”。 一 般 而 言 ,近似 更 
易 使 人 把 握 事物 的 本 质 ,厘清 要 素 的 联系 ,但 过 于 简单 的 近似 又 可 能 使 理论 脱离 实际 。 那 


@ 参与 者 的 特征 包括 他 们 的 可 能 策略 ,优先 选择 甚至 他 们 的 信念 等 。 

四 “在 早期 文献 或 传统 教材 中 ,完全 信息 和 不 完全 信息 之 间 的 差别 主要 体现 在 得 益 函 数 上 。 但 是 ,除了 得 益 函 数 
外 , 它 还 应 包括 规则 .参与 者 .参与 者 偏好 等 要 素 。 可 参见 Thielscher(2010) 等 。 对 规则 ,参与 者 数量 等 信息 不 完全 时 
的 分 析 相 对 较 难 , 因 此 本 书 仍然 以 前 者 为 主 。 
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么 ,模型 是 简单 点 儿 好 ,还 是 复杂 点 儿 好 ? 更 具体 地 说 ,如 何 使 模型 兼 具 易 处 理性 和 切实 
性 ? 仅 就 方法 论 来 讲 , 模 型 越 接近 真实 ,所 用 到 的 分 析 方 法 常常 越 复杂 。 所 以 ,与 前 几 章 
相 比 ,本 章 涉及 的 分 析 方法 将 会 深奥 一 些 ,描述 中 我 们 将 尽 可 能 降低 理论 难度 ,指引 读者 
深入 阅读 。 


5.1 信息 不 对 称 : 知己 不 知 彼 


我 拒绝 加 入 任何 收 我 为 会 员 的 俱乐部 。 
一 一 格 劳 条 。 马 可 斯 (Graujo Marcus) 


5.1.1 何谓 信息 不 对 称 


在 日 常生 活 中 存在 许多 这 样 的 商品 : 包装 精美 却 品质 难 辨 。 例 如 ,瓶装 的 美酒 、 盒 装 
的 香烟 等 。 消 费 者 无 法 从 商品 包装 辨识 质量 优 劣 一 一 精美 包装 既 可 能 意味 着 “ 败 架 其 
中 ”, 也 可 能 “ 物 超 所 值 ”。 显 然 , 消 费 者 和 商家 对 产品 质量 所 掌握 的 信息 是 不 一 样 的 。 邀 
请 会 员 的 俱乐部 ,一 定 是 掌握 了 客户 资料 ,而 客户 却 对 俱乐部 一 无 所 知 。 俱 乐 部 自然 占领 
信息 高 地 ,客户 难免 心 存 疑虑 。 这 种 不 同 主体 所 拥有 信息 多 寒 的 差异 就 是 “信息 不 对 称 ”。 
在 现实 中 ,信息 不 对 称 的 例子 比比 皆 是 。 


< 案例 分 析 : 叔 俯 的 空城 计 


春秋 时 期 , 楚 文王 死 后 , 因 楚 成 王 年 幼 , 由 令 尹 子 元 辅 政 。 子 元 不 图 霸业 , 却 凯 饮 文 王 
夫人 一 一 当时 的 美女 息 妫 。 于 是 借故 在 王宫 旁 建造 馆 舍 , 摇 铃 铎 跳 万 拇 , 欲 以 副 惑 文 夫 
人 。 夫 人 不 为 所 动 , 反 责 其 不 图 中 原 。 话 传 到 子 元 耳 内 ,他 开始 想 建功 立业 ,以 求 夫 人 青 
睐 。 公 元 前 666 年 秋季 , 子 元 亲 率 600 乘 战 车 进攻 郑 国 。 当 时 郑 国 弱小 ,无 法 与 楚 国 匹 
天 , 很 快 失守 楼 析 之 门 。 

郑 国 危 在 旦 夕 , 郑 文公 和 急 召 百 官商 议 。 有 的 主张 纳 款 请 和 ,有 的 主张 背 城 一 战 , 有 的 
主张 固守 待 援 。 郑 国 三 贤 之 一 卡 麻 则 认为 : 请 和 与 决战 都 非 上 策 ,固守 待 援 倒是 可 取 , 而 
且 不 久 楚 兵 自 退 。 但 是 空谈 固守 何其 容易 。 即 使 盟国 齐 国 出 兵 援助 ,也 不 能 解 燃眉之急 。 
郑 文公 仍然 忧虑 ，“ 令 尹 亲 自 挂帅 , 怎 肯 退 兵 ?” 叔 磨 答 道 :“ 自 楚 国 征伐 以 来 ,未 有 用 600 
乘 的 先例 。 公 子 元 心怀 必 胜 之 心 , 实 际 是 想 取悦 文王 夫人 。 和 急于 求 胜 者 ,也 一 定 害怕 失 
败 。 楚 兵 来 了 ,我 自 有 退兵 之 计 。” 

旋即 楚 兵 攻破 外 城 , 郑 文公 采纳 叔 麻 的 计策 ,命令 士兵 全 部 埋伏 在 城内 ,大 开 城 门 , 放 
下 吊桥 , 摆 出 完全 没有 防备 的 样子 。 同 时 ,店铺 照常 营业 ,百姓 往来 如 常 ,不 露 一 丝 慌乱 之 
色 。 楚 军 先 锋 部 队 到 达 郑 都 城下 , 见 此 情景 ,又 见 城 上 毫 无 动静 ,所 以 不 敢 亡 动 ,驻军 等 待 
令 尹 子 元 。 子 元 赶 到 城下 ,亲自 登高 远 上 晃 城 内 , 见 城中 确实 空虚 ,但 又 隐约 看 到 旋 旗 整肃 、 
甲 士 林 立 。 觉 得 其 中 有 诈 ,担心 "万 一 失利 , 何 面目 见 文 夫人 乎 ?" 遂 按兵不动 ,探听 虚实 。 

这 时 齐 国 也 已 接 到 郑 国 的 求援 ,联合 重 、 宋 发 兵 救 郑 。 子 元 闻 报 援兵 将 至 ,害怕 楚 军 
腹背受敌 , 断 难 取胜 ,于 是 瞳 令 全 军 连 夜 撤 退 。 撤 退 时 人 衔 枚 、 马 庄 蹄 ,不 出 一 点 儿 声 响 。 
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同时 , 令 所 有 营 寨 都 不 拆 走 , 族 旗 依 旧 球 扬 。 此 时 郑 国正 在 计 议 后 撤 桐生 的 事 。 待 到 天 亮 
叔 麻 登 城 一 望 ,说道 :“ 楚 军 已 经 撤 走 。" 众 人 不 解 , 都 言 楚 军 族 旗 营 寨 肃 然 。 叔 诬 说 :“ 如 
果 营 中 有 人 , 怎 会 有 乌鸦 盘 旋 呢 ? 楚 兵 也 用 空城 计 其 骗 我 们 ,急忙 撤兵 了 。” 


《孙子 ， 谋 攻 篇 ) 曾 说 过 :“ 知 彼 知己 , 百 战 不 殖 ; 不 知 彼 而 知己 ,一 “国民 站 
胜 一 负 ; 不 知 彼 不 知己 ,每 战 必 败 。" 作 为 知己知彼" 的 注解 ,历史 上 有 
许多 生动 鲜 活 的 事例 。 空 城 计 虽 然 不 为 兵家 常用 ,但 是 却 因为 三国 演 
义 ) 的 演绎 而 众所周知 ,其 中 诸葛 亮 城 头 抚琴 司马 就 狐疑 不 进 的 场景 路 辐 
然 纸 上 。 在 历史 上 ,最 早 的 记载 见于 《 左 传 ), 就 是 权 詹 知己 知 彼 、 智 退 楚 
兵 的 故事 。 
郑 楚 交 兵 ,两 军 阵 前 双方 都 在 探听 对 方 的 消息 ,但 是 仍然 无 法 悉数 尽 知 。 因 此 “知己 
知 披 , 百 战 不 至 ?成 为 军事 战争 的 理想 境界 。 实 际 上 , 它 在 政治 经 济 生活 中 也 有 着 广泛 的 
应 用 。 这 几乎 成 了 博弈 中 的 普遍 扎 求 。 对 于 参与 者 来 讲 , 知 己 是 理性 分 析 的 前 提 , 一 个 连 
自己 拥有 何 种 信息 都 不 清楚 的 参与 者 ,很 难说 他 是 理性 的 。 因 此 第 2 章 中 的 理性 人 假设 ， 
要 求 参 与 者 “知己 ”。 但 是 要 做 到 “ 知 彼 "何其 难 也 。 像 郑 文公 的 大 多 数 臣 傣 一 样 , 现 实 中 
人 们 往往 不 知道 对 手 的 信息 ,属于 * 知 已 不 知 彼 ”。 在 不 知 对 方 准确 信息 的 情况 下 ,如 何 通 
过 观察 形成 自己 的 判断 ?如 何 分 析 对 手 的 反应 ”如 何 行动 才 是 理性 的 ?“ 信 息 不 对 称 ” 理 
论 的 提出 ,为 人 们 探究 答案 提供 了 一 种 系统 分 析 方 法 。 

这 里 所 说 的 信息 是 广义 的 ,一 切 与 博弈 有 关 的 消息 都 是 我 们 要 关心 的 信息 。 如 果 某 
些 信息 是 博 穿 参与 者 都 知道 的 ,或 者 所 有 有 关 的 参与 者 都 知道 ,就 称 作 "公共 信息 ”或 者 
“共同 知识 ”。 在 某 些 情况 下 占 统治 地 位 的 惯例 就 是 共同 知识 。 如 果 某 些 信息 只 有 一 方 参 
与 者 知道 而 其 他 参与 者 不 知道 ,就 称 作 “私有 信息 ”, 意 即 该 参与 者 所 拥有 的 私自 信息 。 所 
谓 信息 不 对 称 , 是 指 博弈 的 各 个 参与 者 所 掌握 的 信息 并 不 一 致 ,至 少 有 一 方 拥有 私有 
信息 。 

如 前 所 述 , 如 果 商 家 没有 披露 有 关 商 品质 量 的 信息 , 则 消费 者 处 于 劣势 地 位 ,无 从 得 
知 这 些 信 息 , 此 时 有 关 商 品质 量 的 信息 就 是 商家 的 私有 信息 。 又 如 影视 剧 中 的 “梭哈 ? 游 
戏 , 其 中 各 家 互 不 知晓 对 家 的 底牌 ,不 知 对 家 拿 到 “同花顺 ”的 概率 ,每 家 的 底牌 就 是 各 自 
的 私有 信息 。 正 是 由 于 私有 信息 的 存在 , 才 出 现 了 信息 不 对 称 现象 。 

信息 不 对 称 现象 广泛 存在 ,而 信息 不 对 称 理论 则 产生 较 晚 ,于 20 世纪 六 七 十 年 代 由 
3 位 美国 经 济 学 家 一 乔治 ， 阿 克 洛 夫 \ 迈 克 尔 "斯 宾 塞 和 约瑟夫 。 斯 蒂 格 利 茨 发 展 起 
来 。 他 们 主要 研究 了 不 对 称 信息 条 件 下 的 市 场 运行 机 制 。 由 于 这 些 开 创 性 工作 ,3 位 经 
济 学 家 于 2001 年 被 授予 诺 贝 尔 经 济 学 奖 。 目 前 ,信息 不 对 称 理论 认为 : 市 场 中 卖方 通常 
比 买 方 更 了 解 有 关 商 品 的 各 种 信息 ; 交易 双方 中 拥有 较 少 信息 的 一 方 会 努力 从 另 一 方 获 
取信 息 ; 掌握 较 多 信息 的 一 方 可 以 通过 向 信息 缺乏 者 传递 可 靠 消息 而 在 市 场 中 获 益 ; 市 
场 中 的 信号 显示 机 制 会 在 一 定 程度 上 弥补 信息 不 对 称 所 带 来 的 问题 ; 等 等 。 目 前 ,与 信 
息 不 对 称 紧密 相关 的 信息 经 济 学 已 经 成 为 信息 科学 的 一 个 主要 分 支 (也 有 观点 认为 属于 
经 济 学 分 支 ) ,其 微观 角度 的 主要 研究 内 容 则 是 信息 的 成 本 和 价格 ,以 及 信息 不 完全 条 件 
下 的 机 制 设计 间 题 。 
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在 桌面 游戏 中 ,你 可 能 会 被 一 再 提醒 游戏 的 规则 、 对 手 实力 、 积 分 排名 等 信息 。 如 果 
想 知道 自己 和 对 手 的 状况 ,可 谓 易如反掌 。 但 在 现实 生活 中 ,信息 往往 需要 你 去 主动 获 
取 。 获 取信 息 的 过 程 ,不 仅 取 决 于 参与 者 的 能 力 和 外 界 条 件 , 还 取决 于 获取 信息 的 成 本 。 
即使 信息 可 获取 ,参与 者 也 会 对 获取 信息 的 成 本 进行 权衡 。 一 般 来 讲 , 在 博弈 中 所 要 获取 
的 信息 越 多 ,所 需 成 本 就 越 大 , 且 呈 非 线性 增长 。 换 个 角度 理解 ,信息 是 有 价 的 ,获取 信息 
需要 支付 相应 的 价格 了 。 

需要 说 明 的 是 ,信息 不 对 称 并 不 一 定 对 应 着 信息 不 完全 。 例 如 ,参与 一 方 可 能 不 知道 
另 一 方 的 历史 行动 ,而 非得 益 函 数 。 此 时 的 信息 不 对 称 主要 体现 在 对 历史 行动 的 记忆 上 ， 
亦 即 博弈 进程 信息 。 回 忆 第 4 章 内 容 , 你 会 发 现 这 种 博弈 属于 完全 但 不 完美 信息 。 与 此 
不 同 , 本 章 将 介绍 至 少 存在 一 方 不 知晓 他 人 得 益 时 的 情况 , 即 不 完全 信息 博弈 ,不 过 ,这 种 
信息 不 完全 在 一 定 条 件 下 仍 可 转化 为 信息 不 完美 ,二 者 具有 很 强 的 内 在 联系 。 


5.1.2 信息 不 完全 时 的 新 难题 


和 矩阵 和 博弈 树 是 建立 模型 与 分 析 时 非常 有 效 的 方法 。 回 顾 前 3 章 所 讨论 的 博弈 情 
景 ,都 可 以 通过 矩阵 或 博弈 树 来 表示 。 现 在 ,我 们 尝试 用 和 矩阵 的 方法 ,对 引 语 故 事 中 楚 国 
兵临城下 时 的 博弈 建立 模型 。 根 据 故事 情节 , 楚 国 的 先锋 部 队 赶 到 时 见 到 城 上 毫 无 动静 ， 
城内 一 如 往常 。 此 时 可 简单 处 理 , 假 设 楚 军 有 两 种 选择 :( 攻 城 ,扎营 ); 郑 国 也 有 两 种 可 
能 选择 : (后 撤 ,坚守 ) 。 

(1) 如 果 楚 国 扎营 、 郑 国 后 撤 , 则 叔 钴 的 计划 失败 , 楚 国立 即 就 能 辨 明 郑 国 意图 转 而 
进攻 。 此 时 双方 得 益 分 别 为 (3, 一 3) 。 

(2) 如 果 楚 国 扎营 而 郑 国 坚 守 , 则 无 论 郑 国 实力 如 何 ,双方 都 没有 交 兵 ,可 假定 收益 
为 (0,0) 。 

(3) 如 果 楚 国 进攻 而 郑 国 后 撤 , 则 楚 国 得 胜 , 郑 国 溃败 。 得 益 分 别 为 (5, 一 5) 。 

(4) 如 果 楚 国 意图 攻 城 而 郑 国 坚 守 ,情况 将 变 得 复杂 。 郑 国 的 军队 是 想 诱 敌 深入 还 
是 已 经 撤离 楚 军 完全 不 清楚 。 假 设 郑 军 是 一 支 多 谋 善战 的 军队 ,那么 他 们 会 想 诱 敌 深 
入 。 若 郑 军 是 一 支 不堪 一 击 的 军队 , 则 可 能 人 去 城 空 。 郑 国 
因此 ,如 果 双 方 采取 的 策略 组 合 为 ( 攻 城 ,坚守 ), 则 楚 后 撤 ”坚守 
军 无 法 判断 双方 的 收益 。 8 

显然 ,这 是 一 个 不 完整 的 博弈 矩阵 ,对 应 ( 攻 城 , 坚 | 
守 ) 策 略 组 合 时 的 收益 是 不 清楚 的 ,如 图 5-1 所 示 。 面 | 
对 一 个 不 完整 的 矩阵 ,该 如 何 分 析 ? 图 5-1 楚 国 兵临城下 时 的 对 讲 

这 是 本 章 所 面临 的 新 难题 : 博弈 矩阵 的 某 些 部 分 已 经 被 对 手 事先 滴 上 了 墨汁 ,参与 
者 看 不 到 某 些 关 键 的 得 益 信 息 , 因 此 信息 是 不 完全 的 。 当 然 ,向 矩阵 滴 墨 汁 的 人 可 以 是 任 
何 一 方 。 这 种 要 素 信息 的 不 对 称 性 是 不 完全 信息 博弈 的 重要 特征 。 接 下 来 ,我 们 尝试 依 


@ 尽管 几乎 所 有 人 都 承认 信息 是 有 价 的 ,但 是 如 何 对 信息 进行 定价 并 不 是 一 件 简单 的 事情 。 本 文 不 再 介绍 这 
一 方面 的 内 容 。 
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照 既 有 的 方法 进行 建 模 。 

假设 郑 国 多 谋 善战 , 楚 国 若 攻 城 ,必然 落 入 郑 国 的 圈套 。 双 方 得 益 分 别 为 (一 2,2)9。 
利用 画 线 法 可 知 均衡 策略 是 (扎营 ,坚守 )。 反 之 ,如 果 郑 国 不 堪 一 击 , 其 坚守 只 能 带 来 楚 
国 的 猛烈 攻击 ,因此 假设 双方 收益 分 别 对 应 于 (4, 一 6)。 同 样 方法 可 知 均衡 策略 为 ( 攻 城 ， 
后 撤 )。 两 种 类 型 的 郑 国 所 对 应 的 矩阵 分 别 如 图 5-2 和 图 5-3 所 示 。 很 显然 ,无 论 郑 国 是 
哪 种 类 型 ,都 存在 唯一 均衡 策略 。 只 要 楚 国 和 郑 国足 够 理性 ,双方 都 会 趋向 于 一 个 明确 的 
均衡 。 既 然 如 此 , 楚 国 为 何 还 犹 殉 不 决 呢 ? 答案 就 在 于 楚 国 所 掌握 的 信息 不 完全 一 一 不 
知道 郑 国 属于 何 种 类 型 。 换 言 之 , 楚 国 不 知道 自己 处 于 图 5-2 和 图 5-3 的 哪个 矩阵 中 。 
由 于 不 同 矩 阵 有 着 不 同 的 均衡 ,而 两 个 均衡 所 对 应 的 行动 又 显著 不 同 。 无 论 楚 国 选择 哪 
个 矩阵 ,都 有 可 能 使 自己 犯错 。 因 此 , 既 有 的 分 析 方法 无 从 分 析 双 方 的 理性 选择 。20 世 
纪 60 年 代 ,天 才 数 学 家 约翰 ， 海 萨 尼 在 这 方面 做 出 了 重大 的 突破 ,使 得 对 不 完全 信息 的 
研究 有 了 得 心 应 手 的 分 析 工 具 。 海 萨 尼 提 出 一 种 转换 方法 ,将 不 完全 信息 博弈 转换 为 第 
4 章 中 的 完全 但 不 完美 信息 博弈 。 这 种 转换 称 作 * 海 萨 尼 转换 ”, 已 经 成 为 分 析 不 完全 信 
息 博 弈 时 的 常用 方法 。 


郑 国 
后 撤 坚守 
攻 碱 
外国 扎 党 
图 5-2 郑 国 是 多 谋 善 型 时 的 矩阵 图 5-3 郑 国 是 不 堪 一 击 时 的 矩阵 


为 方便 学 习 , 在 结束 本 节 之 前 ,我 们 提示 几 个 即将 出 现 的 概念 。 结 合 信息 的 完全 性 和 
行动 的 时 序 ,可 将 博弈 粗略 地 分 为 4 种 类 别 : 完全 信息 静态 博弈 ,不 完全 信息 静态 博弈 
(静态 贝 叶 斯 博弈 ) 完全 信息 动态 博弈 和 不 完全 信息 动态 博弈 (序列 贝 叶 斯 博弈 ) 。 静 态 
贝 叶 斯 博弈 也 称 为 策略 型 贝 叶 斯 博弈 ,在 不 致 混淆 的 情况 下 也 可 简称 贝 叶 斯 博弈 。 与 这 
4 种 类 别 相对 应 ,存在 4 种 常用 的 均衡 概念 : 纳什 均衡 、 贝 叶 斯 纳什 均衡 . 子 博弈 完美 纳什 
均衡 和 完美 贝 叶 斯 纳什 均衡 。 后 两 者 又 分 别 简称 子 博弈 完美 均衡 和 完美 贝 叶 斯 均衡 ,其 
中 完美 贝 叶 斯 均衡 是 贝 叶 斯 纳什 均衡 和 子 博弈 完美 均衡 这 两 种 概念 的 一 个 精练 。 策 略 型 
贝 叶 斯 博弈 的 一 个 常见 例子 是 密封 报价 拍卖 : 每 一 报价 方 都 知道 自己 对 所 售 商品 的 估 
价 ,但 不 知道 任何 其 他 报价 方 对 商品 的 估价 ; 各 方 的 报价 放 在 密封 的 信封 里 上 交 , 可 视 作 
参与 者 同时 行动 。 不 过 ,意义 深远 的 贝 叶 斯 博弈 大 多 是 动态 的 。 正 如 后 文 将 要 看 到 的 , 私 
有 信息 的 存在 十 分 自然 地 导致 和 有 信息 的 拥有 者 试图 去 沟通 (或 者 误导 ) ,同时 也 使 得 没 


@ 有 一 点 必须 清楚 ,如 何 得 出 矩阵 中 得 益 的 具体 值 并 非 我 们 的 关注 重点 。 在 分 析 中 需要 关注 的 是 不 同行 动 (或 
策略 ) 所 对 应 的 得 益 之 间 的 序 关系 。 例 如 ,假设 郑 国 坚守 . 楚 国 攻 城 所 对 应 的 得 益 为 一 2、 一 2. 5、 抑 或 再 少 一 点 儿 , 可 能 
都 不 会 改变 问题 的 本 质 一 一 只 要 在 适度 范围 内 即 可 。 所 谓 适度 范围 内 . 即 指 不 会 影响 到 与 其 他 得 益 相 比 时 的 序 关 系 。 
例如 , 楚 国 在 假定 郑 国 坚 守 时 自己 更 愿意 扎营 ,那么 在 不 改变 这 种 序 关 系 的 前 提 下 ,一 2 变 为 一 2. 3 并 无 本 质 影响 。 当 
然 , 这 种 变更 仍然 具有 相对 性 。 举 例 来 说 ,如 果 有 人 将 一 2 置 为 负 无 穷 ,那么 它 将 蕴含 一 层 新 的 意思 : 楚 国 非常 强烈 地 
偏爱 扎营 。 
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有 私有 信息 的 一 方 试图 去 探测 和 杠 别 。 这 些 都 是 博弈 中 固有 的 动态 因素 。 但 是 ,由 于 不 
完全 信息 动态 博 穿 及 其 所 对 应 的 均衡 概念 ?比较 深奥 ,需要 较 深 的 数学 经 济 知识 和 人 逻辑 
推理 ,因此 本 书 只 做 浅显 介绍 。 本 书 将 重点 介绍 静态 贝 叶 斯 博弈 ,以 使 读者 掌握 不 完全 信 
息 博弈 中 的 均衡 概念 和 信息 的 意义 。 


5.2 构建 贝 叶 斯 博弈 : 海 萨 尼 转 换 


< 引 语 故事: 郭靖 路 姑 对 时 


郭靖 踏 上 一 步 , 拦 在 黄蓉 身 前 , 朗 声 道 :“ 我 二 人 是 九 指 神 丐 洪 帮主 的 弟子 。 我 师妹 
为 铁 掌 帮 琢 千 盆 所 伤 ,避难 来 此 ,前 华 ( 注 : 瑛 姑 ) 若 是 与 铁 掌 帮 有 甚 瓜 葛 , 不 肯 收 留 ,我 们 
就 此 告 苹 。" 说 着 一 捐 到 地 ,转身 扶 起 黄 某 。…… 郭靖 心 道 ;:“ 说 不 得 ,只 好 硬 闻 。” 叫 道 : 
“前 华 , 起 在 下 无 礼 了 。” 身 形 一 沉 , 举 臂 划 个 圆圈 ,一 招 “ 亢 龙 有 悔 ”, 当 门 直 冲 出 去 。 这 是 
他 得 心 应 手 的 厉害 招数 ,只 怕 瑛 姑 抵 挡 不 住 , 劲 道 只 使 了 三 成 , 惟 求 夺 门 而 出 ,并 无 伤 人 之 
意 。 眼 见 掌 风 袭 到 瑛 站 身 前 ,郭靖 要 瞧 她 如 何 出 手 , 而 定 续 发 掌 力 或 立即 回收 , 哪 知 她 身 
子 微 侧 ,左手 前 臂 斜 推 轻 送 , 竞 将 郭靖 的 掌 力 化 在 一 旁 。 郭 请 料想 不 到 她 的 身手 如 此 高 
强 , 被 地 这 么 一 带 , 竟 然 立足 不 住 ,向 前 抢 了 半 步 。……- 
-一 节选 自 金 庸 ( 射 雕 英雄 传 (29)。 黑 沼 隐 女 》 


武林 中 人 在 过 招 之 前 ,往往 要 对 敌手 有 些许 的 试探 。 现 在 我 们 设想 一 个 场景 : 一 位 
武林 盟主 与 一 名 深山 隐士 在 客栈 偶遇 ,客观 所 致 ,马上 将 要 刀 兵 相 接 。 武 林 盟 主 完全 不 知 
站 在 自己 面前 的 是 一 名 "绝世 高 手 还 是 “江湖 术士 >。 然而 作为 武林 盟主 的 他 却 声 名 远 
播 ,性 情 秉 性、 武功 门派 都 被 对 方 看 得 一 清二 楚 ; 与 此 相对 ,深山 隐士 并 没有 透露 自己 身 
份 的 一 点 点 信息 。 他 是 神秘 的 ,他 的 信息 是 私有 的 ,或 者 说 对 于 盟主 而 言 是 不 完全 的 。 这 
样 的 博弈 应 该 如 何 分 析 ? 让 我 们 引入 一 种 新 的 方法 : 海 萨 尼 转 换 。 


5.2.1 海 萨 尼 转换 的 基本 思 


本 节 将 借助 武林 盟主 和 深山 隐士 之 间 的 武林 大 战 来 介绍 海 萨 尼 转 换 。 先 从 简单 情景 
开始 。 假 设 二 人 几乎 同时 出 手 , 在 自己 行动 时 看 不 到 对 手 的 招式 ; 或 者 即使 看 到 ,也 来 不 
及 做 出 反应 ,而 只 能 顺 着 自己 的 招数 走 。 如 果 只 考察 一 个 回合 的 话 , 二 人 对 战 就 相当 于 一 
个 静态 博弈 ,其 中 的 博弈 要 素 如 下 。 

博弈 的 情景 : 武林 大 战 。 

博弈 参与 者 : (武林 盟主 ,深山 隐士 ) 。 

参与 者 的 策略 : 

武林 盟主 可 能 采取 : 


@ 在 不 完全 信息 博弈 中 ,除了 完美 贝 叶 斯 均衡 还 存在 其 他 的 均衡 概念 ,如 序 贯 均衡 . 颜 抖 手 均衡 等 。 


162 博弈 论 入 门 


进攻 : 强势 出 招 ,以 求 一 招 制 敌 。 
防守 : 保守 招架 , 待 看 出 对 方 破绽 后 再 行动 。 
深山 隐士 可 能 采取 : 
进攻 : 主动 出 招 大 胆 挑战 盟主 。 
防守 : 等 待 寻求 对 方 的 破绽 。 
博弈 的 得 盖 : 
依据 前 文 介绍 ,深山 隐士 有 两 种 可 能 的 类 型 : 
1: 绝世 高 手 , 其 武功 能 与 盟主 一 较 高 下 。 
2: 江湖 术士 ,会 被 盟主 轻易 击败 ,但 也 可 能 趁 人 不 备 .投机 取 巧 。 
如 果 深 山 隐士 是 类 型 1: 
(1) 武林 盟主 进攻 ,而 深山 隐士 也 进攻 ,双方 都 得 不 到 任何 好 处 ; 虽然 双方 都 战胜 不 
了 对 方 , 但 都 提升 了 声誉 。 得 益 组 合 为 (2,2) 。 
(2) 武林 盟主 强势 出 招 ,而 深山 隐士 选择 保守 ,双方 势均力敌 , 守 势 一 方 甘 拜 下 风 。 
得 益 组 合 为 (3,1) 。 
(3) 武林 盟主 选择 保守 ,而 深山 隐士 强势 挑战 , 则 武林 盟主 处 于 下 风 。 此 时 得 益 组 合 
为 (Ly 
(4) 武林 盟主 保守 出 招 ,而 深山 隐士 也 保守 等 待 ,双方 都 见 好 就 收 ,伺机 再 战 。 得 益 
组 合 对 应 为 (0,0) 。 
与 绝世 高 手 对 战 时 的 和 矩阵 如 图 5-4 所 示 。 
如 果 深 山 隐士 是 类 型 2: 
(1) 武林 盟主 强势 出 招 ,而 深山 隐士 也 强势 出 招 。 隐 士 必然 瞬间 倒 地 。 得 益 组 合 为 
(0,—3)。 
(2) 武林 盟主 强势 出 招 ,而 深山 隐士 保守 等 待 。 虽 然 盟主 轻而易举 地 击败 了 隐士 ,但 
是 击败 毫 无 防守 的 弱者 会 降低 他 的 声誉 。 隐 士 也 因 处 于 防御 姿态 而 免 受 重 伤 。 得 益 组 合 
为 (一 交 二 业 。 
(3) 武林 盟主 保守 出 招 ,而 深山 隐士 强势 挑战 。 武 林 盟 主 虽 不 甘心 ,但 仍 好 过 伤 及 弱 
者 。 隐 士 则 空 耗 功力 , 赚 得 些许 声誉 ,相当 于 一 无 所 获 。 对 应 得 益 组 合 为 (1.0) 。 
(4) 武林 盟主 保守 观战 ,而 深山 隐士 也 保守 等 待 ,双方 都 见 好 就 收 。 此 时 深山 隐士 赚 
得 声誉 ,被 认为 他 可 与 武林 盟主 过 招 ,而 盟主 则 无 得 无 失 。 对 应 的 得 益 为 (0,1) 。 
与 江湖 术士 对 战 时 的 矩阵 如 图 5-5 所 示 。 
隐士 
进攻 防守 


图 5-4 与 绝世 高 手 对 战 时 的 矩阵 图 5-5 与 江湖 术士 对 战 时 的 矩阵 


第 5 章 不 完全 信息 博弈 163 


不 难得 知 ,隐士 为 类 型 1 时 的 均衡 为 (进攻 ,进攻 )。 双 方 将 会 兵 戎 相 见 , 训 不 退让 。 
而 隐士 为 类 型 2 时 的 均衡 则 为 (防守 ,防守 )。 请 读者 回忆 第 4 章 内 容 , 一 个 完全 信息 静态 
博弈 在 本 质 上 等 同 于 一 个 二 阶段 完全 但 不 完美 信息 的 动态 博弈 。 因 此 ,隐士 身份 不 同时 
所 对 应 的 静态 博弈 可 分 别 用 图 5-6 中 的 两 个 不 完美 动态 博弈 来 表示 。 显 然 ,此 时 均衡 仍 
然 同 静 态 博弈 的 均衡 一 致 
博弈 1 : 隐士 是 绝世 高 手 博弈 2 : 隐士 是 江湖 术士 


武林 盟主 


(2.2) G3.1) (13) (0.0)(0.-3) (-2,-1) (1.0) (0.D) 


图 5-6 武林 大 战 博弈 的 两 种 情况 


如 果 盟 主 已 知 对 手 是 绝世 高 手 , 自 然 不 会 小 遍 ,那么 他 必然 会 选择 英勇 出 击 ; 反之 对 
手 若是 江湖 术士 ,发 起 挑战 实 为 投机 取 巧 或 无 端 生 事 , 那 么 他 选择 防守 则 是 上 策 。 问 题 在 
于 ,隐士 是 高 手 还 是 术士 只 有 他 自己 知道 ,是 他 的 私有 信息 。 盟 主 在 做 出 选择 时 并 不 知道 
对 手 的 真实 身份 ,当然 也 无 法 确定 身 处 何 种 博弈 中 。 可 认为 盟主 处 在 图 5-6 的 两 个 博弈 
中 。 但 这 又 是 一 个 博弈 ,因为 实际 上 只 有 一 次 二 人 对 阵 。 所 以 这 是 矛盾 的 。 如 果 依 照 第 
4 章 的 思路 ,可 以 认为 盟主 不 知道 自己 身 处 哪个 分 支 。 此 时 可 用 虚线 将 博弈 1 和 博弈 2 
的 起 点 连 起 来 ,表示 他 们 处 于 同一 个 信息 集中 。 这 是 讨论 完美 信息 博弈 时 所 使 用 的 方法 。 
你 会 发 现在 完美 信息 中 起 点 只 有 一 个 ,可 以 非常 顺畅 地 使 用 逆向 归纳 法 ,但 在 这 里 不 行 。 
使 用 逆向 归纳 法 递 推 时 ,我 们 不 清楚 将 回 到 哪个 起 点 。 这 意味 着 盟主 想 要 到 达 某 一 个 结 
局 时 ,将 不 知道 从 何 处 开始 ! 或 者 说 ,盟主 不 知道 采用 什么 样 的 策略 才能 达成 他 所 希望 的 
结果 。 显 然 ,无 法 直接 使 用 逆向 归纳 法 。 那 么 ,能 否 创 造 条件 使 用 逆向 归纳 法 呢 ? 

对 这 类 问题 最 直观 的 解决 办 法 就 是 判断 自己 到 底 身 处 哪 种 博弈 之 中 。 而 这 对 于 每 个 
信息 不 完全 的 参与 者 或 博弈 分 析 者 来 讲 ,都 是 十 分 困难 的 。 幸 和 运 的 是 约翰 。 海 萨 尼 于 
1967 年 前 后 提出 了 一 种 可 操作 的 、 易 于 掌握 的 分 析 方法 一 一 海 萨 尼 转换 。 海 萨 尼 转 换 通 
过 引入 “自然 "这 一 虚拟 局 中 人 ,对 无 法 确定 的 参与 者 类 型 一 一 他 的 私有 信息 一 一 交 由 “ 自 
然 " 来 确定 。 在 此 基础 上 人 们 才能 采用 既 有 的 确定 性 分 析 方法 来 研究 。 让 我 们 回 到 武林 
大 战 ,一 步 步 完 成 这 种 转换 。 

在 转换 之 前 , 先 确 认 问题 的 根源 。 如 上 所 述 ,问题 根源 在 于 盟主 无 法 确定 自己 身 在 何 
种 博弈 之 中 。 换 言 之 ,盟主 同时 面临 两 个 博弈 树 ,或 者 说 面临 两 种 对 手 身 份 的 不 确定 性 。 
这 种 不 确定 性 的 特征 有 哪些 呢 ? 首先, 对 可 能 的 身份 类 型 有 所 认 知 ,但 并 不 能 确定 具体 是 
哪 种 身份 类 型 。 一 般 来 讲 , 盟 主 遇见 一 个 陌生 对 手 时 会 快速 形成 自己 的 想法 ,然后 再 确定 


164 博弈 论 入 门 


如 何 出 招 ,但 他 无 法 确切 知道 对 方 的 具体 类 型 。 其 次 ,每 次 博弈 有 且 只 有 一 种 类 型 出 现 。 
最 后 ,作为 盟主 他 能 够 从 一 次 次 的 重复 或 类 似 事 件 中 获取 经 验 ,对 不 同类 型 的 可 能 性 高 低 
具有 基本 判断 。 上 述 3 点 基本 对 应 于 随机 现象 的 3 个 特征 。 目 前 可 能 存在 的 问题 是 , 任 
一 类 型 所 发 生 的 可 能 性 是 否 为 盟主 尽 知 。 如 果 它 是 事前 已 知 的 ,就 可 以 利用 随机 事件 来 
描述 了 。 换 言 之 ,如 果 利用 随机 事件 描述 ,前 提 是 盟主 知道 对 手 身 份 类 型 的 概率 分 布 。 而 
这 种 概率 显然 不 由 盟主 或 隐士 决定 。 每 个 身份 类 型 出 现 的 概率 是 一 个 相对 客观 的 值 。 它 
取决 于 盟主 的 过 往 经 验 , 是 一 个 能 够 被 主观 感知 的 客观 存在 9。 既 是 客观 存在 ,不 妨 假定 
大 自然 决定 了 对 手 身 份 的 概率 分 布 。 
分 思考 与 练习 

当 对 手 身份 类 型 的 概率 分 布 未 知 时 ,能 够 采用 海 萨 尼 转 换 吗 ? 

现在 ,引入 “自然 "。 如 第 4 章 所 述 ,“ 自 然 " 是 博弈 树 的 虚拟 参与 者 。 这 一 步 又 将 赋予 
隐士 一 个 概率 : 一 定 的 概率 是 高 手 , 一 定 的 概率 是 术士 。 在 博弈 的 第 一 阶段 ， 自 然 ?选择 
高 手 或 者 术士 。 必 须 指 出 ,盟主 看 不 到 “自然 "的 选择 , 意 即 他 对 隐士 的 身份 类 型 缺乏 了 解 。 
但 是 隐士 却 对 自己 的 身份 完全 清楚 , 意 即 他 能 看 到 “自然 "的 选择 。 这 是 隐士 的 私有 信息 。 

简单 起 见 ,假设 隐士 为 “绝世 高 手 ” 的 概率 和 二 0. 5, 为 “江湖 术士 ?的 概率 pz 王 1 一 
p11 二 0.5。 于 是 武林 大 战 可 表示 为 图 5-7 所 示 的 扩展 型 。 这 是 一 个 完全 但 不 完美 信息 博 
弈 ,其 中 "自然 ”的 选择 对 盟主 而 言 是 不 完美 的 。 至 此 ,我们 完成 了 海 萨 尼 转换 : 将 不 知 对 
手 得 益 的 不 完全 信息 博弈 转换 为 可 分 析 的 完全 但 不 完美 信息 博弈 。 


自然 


武林 盟主 


(2.2) (3,1) (1,3) (0,0) (0,—3) (=2,—1) (1,0) (0,1) 
图 5-7 “自然 "决定 隐士 类 型 时 的 武林 大 战 博弈 


接 下 来 ,讨论 所 遇 到 的 不 确定 性 。 关 于 两 种 可 能 类 型 的 概率 分 布 ,在 此 被 视 为 共同 知 
识 , 这 点 十 分 重要 ,特别 当 双 方 都 拥有 私有 信息 时 。 它 表明 : 所 有 参与 者 关于 “自然 "行动 


@ 关于 概率 是 否 客观 存在 ,如 何 为 决策 者 所 感知 ,以 及 是 否 完全 依赖 于 个 人 主观 等 问题 ,请 读者 参阅 梅 尔 森 的 
《博弈 论 : 矛盾 冲突 分 析 ) 第 一 章 3 一 9 页 。 
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的 信念 是 相同 的 。 同 时 , 它 也 意味 着 每 个 人 都 能 够 换 位 思考 , 付 诸 理 性 。 如 果 不 是 共同 知 
识 , 双 方 可 能 对 某 些 事件 所 发 生 的 概率 存在 分 歧 , 进 而 导致 双方 对 未 来 的 预测 不 一 致 。 虽 
然 “ 共 同 知识 ”这 一 要 求 对 于 诸如 "天 气 变化 ?等 客观 事件 比 *“ 个 人 喜好 ”等 主观 事件 更 为 合 
理 , 但 是 在 经 过 一 些 数学 处 理 和 逻辑 证 明 后 ,人 们 发 现在 不 完全 信息 中 将 参与 者 类 型 的 概 
率 分 布 视 为 共同 知识 并 不 需要 严 苛 的 条 件 。 它 具有 普遍 的 适用 情景 ,因此 常 被 视 为 海 萨 
尼 转 换 的 公理 性 要 求 。 总 之 ,盟主 知道 隐士 的 类 型 分 布 ,隐士 也 知道 盟主 知道 自己 的 类 型 
分 布 。 结 果 如 图 5-7 所 示 。 

基于 上 述 的 准备 工作 ,再 次 使 用 逆向 归纳 法 。 在 隐士 是 类 型 1 的 情况 下 均衡 为 ( 进 
攻 , 进 攻 ) ,盟主 选择 进攻 ,得 益 为 (2,2); 隐士 是 类 型 2 的 情况 下 均衡 为 (防守 ,防守 ), 盟 
主 选择 防守 ,得 益 为 (一 1,1)。 显 然 ,两 种 类 型 下 都 为 最 优 的 策略 是 不 存在 的 ,我 们 可 以 利 
用 自然 选择 ,计算 出 每 个 策略 的 期 望 得 益 。 

(1) 如 果 盟 主 选择 进攻 ,那么 它 的 得 益 是 : 0.5X2 十 0.5X( 一 2) 王 0。 

(2) 如 果 盟 主 选 择 防守 ,那么 它 的 得 益 是 : 0.5X1 十 0. 5X0=0. 5。 

如 果 盟 主 是 理智 的 ,那么 它 必然 会 选择 防守 策略 。 从 博弈 的 扩展 型 可 以 看 出 ,如 果 隐 
士 是 高 手 , 则 会 选择 进攻 ,和 否则 防守 。 因 此 ,最 后 结果 如 下 。 

(1) 选择 防守 策略 ,他 的 期 望 得 益 为 0.5; 而 实际 得 益 可 能 为 1 或 0。 具 体 为 何 值 要 
视 隐 士 的 类 型 而 定 , 盟 主 并 不 能 确 知 。 

(2) 如 果 隐 士 是 高 手 , 则 得 益 为 3; 否则 得 益 为 1。 而且, 隐士 十 分 清楚 自己 的 位 置 。 

在 武林 大 战 的 故事 中 ,无 论 隐士 怎样 选择 ,最 终 的 收益 都 无 法 优化 一 一 即便 他 知己 知 
彼 。 嚼 主 的 可 能 策略 有 两 种 : 进攻 和 防守 ,但 是 只 能 保证 期 望 收益 为 0.5, 而 实际 收益 则 
不 能 确定 ,所 以 这 是 一 种 不 完全 归纳 推理 , 意 即 以 对 某 类 事物 中 部 分 对 象 的 判断 为 前 提 ， 
推出 对 全 体 对 象 的 判断 并 得 出 结论 。 

最 后 ,对 海 萨 尼 转 换 过 程 进行 总 结 。 如 前 所 述 ,在 1967 年 以 前 人 们 尚未 找到 很 好 的 
方法 来 处 理 不 完全 信息 博弈 。 现 在 , 海 萨 尼 转换 已 经 被 普遍 认同 。 跳 出 武林 大 战 的 具体 
情景 , 回 到 更 一 般 的 方法 中 来 , 海 萨 尼 转 换 可 以 归结 如 下 。 

(1) 引入 一 个 虚拟 的 参与 者 自然", 由 其 首先 决定 参与 者 的 类 型 。 

(2)“ 自 然 ? 将 私有 信息 拥有 者 的 类 型 告知 该 参与 者 ,但 对 其 他 参与 者 保密 。 

(3) 针对 不 同类 型 建立 子 博弈 ,分别 对 应 于 “自然 ”的 选择 。 

(4) 博弈 结束 ,各 方 看 到 博弈 结果 ,得 到 各 自 的 得 益 。 


( 科 ttf 六 自然 "的 引入 与 海 萨 尼 续 换 的 作用 


“自然 ?这 一 角色 的 引入 ,并 非 生 硬 牵 强 。 回 忆 前 文 , 我 们 在 武林 大 战 的 分 析 中 曾 多 次 
涉及 逆向 归纳 法 。 在 建 模 和 转换 的 初始 阶段 ,我 们 先 找到 问题 的 结尾 (而 不 是 源头 ), 从 结 
尾 处 寻找 一 个 最 优 行动 ,再 向 前 归纳 ,得 到 前 一 步 的 解 , 如 此 反复 。 而 “自然 "的 引入 ,是 整 
个 环节 的 “最 后 一 步 ”。 

关于 “自然 "这 一 虚拟 参与 者 的 引入 ,可 做 如 下 想象 。 最 初 建立 这 个 模型 的 人 十 分 清 
楚 不 完全 信息 将 会 带 来 的 困难 ,并 且 对 这 个 问题 手足 无 措 ,他 在 给 出 答案 之 初 只 是 简单 地 
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求解 了 问题 的 后 半 段 ,并 未 给 出 自然 这 一 奇异 的 参与 者 。 在 一 段 时 间 的 买 思 苦 想 之 后 ,他 
确定 在 现 有 假设 的 基础 上 ,很 难 利用 既 有 方法 给 出 答案 。 这 时 他 转 过 头 来 问 自己 ,在 日 常 
生活 中 人 们 是 如 何 做 出 判断 的 ? 然后 他 发 现 判断 基于 经 验 。 试 想 一 个 国王 正在 审视 一 个 
流亡 本 国 的 人 。 他 心里 也 许 会 想 , 这 个 人 或 许 是 外 国 的 勇士 ,落难 的 学 者 ,甚或 普通 的 农 
民 。 一 切 都 只 是 猜测 ! 基于 这 个 思想 ,如 果 假 定 所 有 理性 人 的 猜想 都 几乎 一 臻 这 样 
就 相当 于 引入 了 自然 , 它 赋予 了 每 人 一 个 共同 知识 。 值 得 一 提 的 是 ,这 个 假定 类 似 公理 是 
不 可 或 缺 的 , 它 建 基于 每 个 参与 者 尽 可 能 完全 地 想象 所 有 可 能 情况 从 而 形成 的 一 个 信念 。 
尽管 这 种 信念 与 实际 的 信念 并 非 完全 一 致 ,但 它 越 接近 实际 的 信念 ,参与 者 的 行为 就 越 符 
合理 性 、 越 少 偏离 。 

通过 引入 “自然 ", 海 萨 尼 转换 将 无 法 分 析 的 不 完全 信息 博弈 转化 为 大 家 所 熟悉 的 不 
完美 信息 博弈 。 此 时 ,信息 优势 得 以 在 均衡 求解 (而 非 建 模 过 程 ) 中 体现 。 可 见 , 海 萨 尼 转 
换 相当 于 换个 角度 看 问题 。 

举 一 个 简单 的 例子 来 说 明海 萨 尼 转换 的 作用 。 参 与 者 A 和 参与 者 也 是 村 里 有 名 的 
挑 担 工 。 这 一 天 他 们 想 看 看 谁 挑 担 时 更 加 平稳 ,于 是 决定 比赛 挑 水 。 赛 前 A 分 到 了 一 个 
正常 的 木 桶 ,而 也 的 木 桶 缺失 一 块 木 条 。 忆 举 手 示意 比赛 不 公平 ,他 自己 的 木 桶 完全 盛 不 
下 一 滴水 (假设 只 允许 木 桶 直立 ) 。 裁 判 看 了 看 ,就 改 了 比赛 规则 ,让 他 们 两 个 人 把 木 桶 扣 
过 来 ,用 木 通 底 托 大 米 , 看 谁 托 的 多 。 

原本 由 于 木 桶 的 不 同 ( 信 息 不 对 称 ) 而 无 法 看 出 谁 挑 担 时 更 加 稳定 ,裁判 却 在 此 做 了 
个 巧妙 的 转换 。 在 更 改 比赛 规则 之 后 ,两 个 木 桶 虽然 仍 不 相同 (仍然 信息 不 对 称 ) ,但 是 却 
可 以 利用 新 的 比赛 加 以 评判 。 


每 个 参与 者 在 行动 时 拥有 对 自己 所 处 位 置 的 预期 , 海 萨 尼 转 换 就 是 在 这 种 假设 下 完 
成 的 。 不 过 ,这 种 预期 (期 望 ) 不 同 于 在 此 之 前 所 遇 到 的 期 望 。 首 先 , 它 不 同 于 混合 策略 中 
的 期 望 一 一 它 不 单单 派生 于 参与 者 的 均衡 行动 ,还 可 能 面 对 与 那个 行动 不 一 致 的 情形 ; 
其 次 , 它 有 别 于 贝 叶 斯 博弈 中 的 期 望 一 一 它 不 单单 是 从 均衡 行动 和 关于 机 会 行动 的 外 部 
信息 推断 而 来 ; 最 后 , 它 更 不 像 完 全 信息 扩展 博弈 中 的 期 望 一 一 它 不 仅仅 与 过 去 的 事情 

当然 ,即便 对 博弈 做 了 海 萨 尼 转 换 ,不 确定 性 (对 类 型 的 判断 ) 仍 然 存在 。 但 是 ,对 类 
型 的 判断 已 经 从 形式 上 变 成 了 对 博弈 进程 一 一 自然 选择 一 一 的 判断 ,其 概率 分 布 仍然 与 
参与 者 类 型 的 分 布 相 一 致 。 显 然 , 海 萨 尼 转 换 实际 上 将 不 完全 信息 的 博弈 (包括 动态 和 静 
态 ) 转 化 为 完全 但 不 完美 信息 的 动态 博弈 。 这 里 的 不 完美 是 指 ， 自 然 ” 虽 然 做 出 了 它 的 选 
择 , 但 其 他 参与 者 并 不 知 其 详 ,而 仅 知 选择 的 概率 分 布 。 可 见 , 海 萨 尼 转换 使 得 逆向 归纳 
法 和 数学 工具 的 使 用 成 为 可 能 ,这 也 是 它 被 广 为 接 受 的 主要 原因 。 


分 思考 与 练习 


如 果 盟 主 是 一 位 新 人 ,隐士 不 知道 他 将 使 用 “ 降 龙 十 八 掌 ”还 是 “ 伏 虎 六 十 四 拳 ”。 若 
二 人 同时 出 招 , 又 该 如 何 建立 模型 并 进行 海 萨 尼 转换 ? 
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5.2.2 贝 叶 斯 博弈 的 策略 式 描述 


如 前 文 所 述 , 在 贝 叶 斯 博弈 中 参与 者 对 于 其 他 人 的 收益 函数 、 策 略 集合 以 及 特征 信息 
等 了 解 得 不 够 完备 。 而 本 章 主要 讨论 收益 函数 不 完全 时 的 情况 : 至 少 有 一 个 参与 者 无 法 
确 知 其 他 参与 者 的 收益 。 在 对 不 完全 信息 博弈 给 出 策略 式 描 述 之 前 ,请 回忆 一 个 策略 型 
博弈 所 应 具有 的 3 个 要 素 : 参与 者 集合 N= 二 {1,2,…,n) ,每 个 参与 者 i 的 可 能 行动 集合 
Ai, 以 及 他 的 得 益 函 数 ui ,i 二 1,2,…,n。 如 同 第 2 章 的 静态 博弈 ,在 策略 式 贝 叶 斯 博弈 中 
所 有 参与 者 同时 行动 。 但 不 同 的 是 , 任 一 参与 者 i 的 行动 集合 A; 依赖 于 他 的 类 型 0;, 简 
称 为 类 型 依存 的 。 同 时 ,对 应 于 不 同行 动 组 合 的 得 益 w 也 是 类 型 依存 的 。 尽 管 与 前 几 章 
的 概念 一 脉 相 承 ,但 是 仍 有 新 意 , 因 此 需要 事先 明确 类 型 .策略 和 得 益 函 数 等 概念 。 

首先 ,参与 者 的 类 型 。 我 们 在 武林 大 战 中 已 经 使 用 过 这 个 概念 ,只 是 并 未 详 述 。 一 个 
参与 者 的 类 型 , 指 他 的 私有 信息 ,包括 自己 知晓 而 别人 不 知 的 偏好 特征 、 内 部 信息 、 决 策 数 
据 等 。 通 常 来 讲 , 一 个 参与 者 的 类 型 可 能 是 与 其 决策 相关 的 任何 非 共 同 知 识 的 信息 。 这 
些 私 有 信息 往往 影响 他 的 得 益 函 数 ,以 及 其 他 人 对 他 的 判断 。 在 武林 大 战 中 ,盟主 不 知道 
隐士 到 底 是 高 手 还 是 术士 ,因此 (高 手 , 术 士 ) 就 是 隐士 的 类 型 。 如 果 古 诺 模 型 中 的 企业 互 
不 知晓 对 方 的 生产 成 本 , 则 企业 的 类 型 是 其 生产 成 本 。 为 分 析 方 便 , 参 与 者 类 型 常 简 记 为 
数字 ,如 武林 大 战 中 隐士 的 类 型 (高 手 , 术 士 ) 可 简 记 为 (1,2)。 进 一 步 , 用 表示 参与 者 的 类 
型 ,9; 表示 参与 者 i 的 类 型 集合 ,并 且 需 有 0 € @i。 

显然 ,对 于 没有 私有 信息 的 参与 者 而 言 ,其 类 型 退化 为 只 有 一 个 ,可 忽略 不 谈 。 因 此 ， 
仅 考虑 具有 私有 信息 的 参与 者 , 即 可 能 类 型 不 止 一 个 的 参与 者 。 进 一 步 ,如 果 所 有 参与 者 
的 类 型 集合 只 包含 一 个 元 素 , 则 不 完全 信息 静态 博弈 就 退化 为 完全 信息 静态 博弈 。 换 言 
之 ,完全 信息 静态 博弈 可 以 理解 为 不 完全 信息 静态 博弈 的 一 个 特例 。 另 外 ,如 果 参 与 者 的 
类 型 是 完全 相关 的 ,那么 当 一 个 参与 者 观测 到 自己 的 类 型 时 也 就 推出 了 其 他 参与 者 的 类 
型 ,因此 该 博弈 实则 为 完全 信息 的 。 为 此 假定 参与 者 的 类 型 是 相互 独立 的 ?了 。 

其 次 ,参与 者 的 行动 和 策略 。 在 完全 信息 静态 博弈 中 ,所 有 参与 者 同时 行动 , 任 一 参 
与 者 i 的 策略 集合 Si 等 同 于 他 的 行动 集合 A;。 但 是 在 不 完全 信息 下 参与 人 i 的 行动 集 
合 Ai 可 能 依赖 于 他 的 类 型 9;。 策 略 同样 如 此 ,因而 不 再 简单 地 等 同 于 行动 。 例 如 ,在 武 
林 大 战 中 盟主 没有 私有 信息 ,因此 行动 集合 是 (进攻 ,防守 )。 至 于 隐士 ,尽管 在 本 章 中 对 
应 于 “高 手 ” 和 “术士 "的 行动 集合 都 是 (进攻 ,防守 ), 但 是 大 多 情况 下 并 非 如 此 ,而 是 随 着 
类 型 变化 的 。 例 如 , 当 隐 士 是 “高 手 " 时 的 行动 集合 为 (进攻 ,防守 ) ,而 为 “术士 "时 则 可 能 
变 为 (陷害 , 求 伐 )。 用 Ai(0i) 表 示 参 与 者 i 在 类 型 为 0; 时 的 行动 集合 ,ai(0i) € Ai(0;) 表 
示 其 中 的 某 个 具体 行动 。 例 如 , “防守” 和 “进攻 ”是 对 应 于 “高 手 ” 的 两 个 具体 行动 “陷害 ” 
和 “ 求 化 ”是 对 应 于 “术士 "的 两 个 具体 行动 。 

参与 者 的 一 个 策略 则 是 指 一 个 从 类 型 集合 到 行动 集合 的 函数 , 记 作 si(0;:)。 所 有 策 


@ 虽然 在 概率 论 中 “不 相关 ”和 “独立 "是 两 个 不 同 的 概念 ,但 是 在 你 熟悉 了 二 者 的 区 别 和 联系 之 后 就 会 发 现 这 
样 假设 并 无 不 妥 。 
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略 构成 了 参与 者 的 策略 集合 , 它 是 一 个 关于 函数 的 集合 ,不 再 深入 讨论 。 相 对 于 扩展 式 博 
弈 来 说 , 贝 叶 斯 博弈 中 参与 者 的 一 个 行动 表示 了 这 样 一 个 计划 : 在 他 确 知 自己 的 类 型 之 
后 ,为 自己 认为 可 能 的 每 个 偶然 事件 所 确定 的 一 个 动作 。 显 然 , 此 时 的 “行动 * 既 有 别 于 扩 
展 式 博弈 中 的 行动 ,也 不 同 于 其 中 的 策略 一 一 但 更 接近 前 者 。 因 此 我 们 把 贝 叶 斯 模型 中 
参与 者 的 选择 对 象 称 作 一 个 “行动 ”, 而 不 是 一 个 “策略 ”。 然 而 ,他 的 一 个 “策略 ” 则 被 定义 
为 : 从 他 的 类 型 集合 到 行动 集合 的 一 个 函数 一 个 对 应 关系 。 璧 如 ,将 武林 大 战 中 “术士 ” 
的 行动 集合 变更 为 (陷害 , 求 侥 ), 则 当 隐 士 为 “术士 "时 “ 求 化” 是 他 的 一 个 行动 。 而 {( 高 
手 , 进 攻 ), (术士 ,陷害 )} 则 是 隐士 的 一 个 策略 , 意 即 当 隐 士 为 高 手 时 选择 进攻 ,反之 则 陷 
害 对 方 。 进 一 步 讲 ,动态 贝 叶 斯 博弈 的 行动 限于 参与 者 在 既定 类 型 下 某 个 阶段 时 的 一 个 
动作 ,而 策略 则 指 对 应 于 所 有 可 能 类 型 所 有 阶段 中 的 多 个 动作 组 合 的 一 种 函数 关系 。 

青 次 ,参与 者 的 得 益 函 数 。 显 然 ,参与 者 的 得 益 函 数 也 是 类 型 依存 的 ,可 用 wi (ai,a-i， 
和) 表示 当 参 与 者 ;在 类 型 0; 时 的 得 益 函 数 ,其 中 a-; 表 示 对 手 的 行动 。 例 如 ,类 型 为 “术士 ” 
的 隐士 选择 进攻 而 盟主 防守 时 ,隐士 的 得 益 为 xz (进攻 ,防守 ,术士 ) 王 0( 参 见 图 5-5)。 

最 后 , 海 萨 尼 转换 引入 “自然 ?作为 虚拟 参与 者 ,参与 者 的 类 型 交 由 “自然 ?选择 。 从 数 
学 上 讲 , 需 引入 一 个 (多 个 ) 随 机 变量 表示 “自然 ”的 选择 状态 。 这 个 随机 变量 的 可 能 取 值 
对 应 于 参与 者 的 可 能 类 型 ,并 且 明 确 了 任 一 可 能 类 型 出 现 的 概率 。 请 注意 这 种 转换 允许 
所 有 参与 者 拥有 不 同 的 先 验 概率 。 进 一 步 ,这 些 概率 也 可 能 是 相关 的 ,因此 参与 者 将 在 知 
道 自己 类 型 的 条 件 下 对 其 他 参与 者 的 类 型 进行 推断 。 显 然 ,这 是 一 个 条 件 概 率 , 称 为 参与 
者 的 信念 (或 推断 ) , 记 作 pi(0-i|0:)。 简 单 起 见 ,可 将 参与 者 的 信念 视 为 同 分 布 的 0, 并 与 
一 个 “客观 的 ?测度 相 一 致 。 同 时 ,在 参与 者 类 型 相互 独立 的 情况 下 ,参与 者 信念 可 视 作 先 
验 的 。 一 般 情况 下 ,参与 者 会 通过 观察 信号 来 进行 推断 ,因此 在 进行 贝 叶 斯 推断 时 已 知事 
件 包 括 但 不 限于 参与 者 的 类 型 。 例 如 ,盟主 可 以 从 隐士 的 衣着 举止 来 判断 他 更 像 高 手 抑 
或 术士 。 

在 介绍 完 上 述 3 个 要 素 之 后 ,现在 给 出 贝 叶 斯 博弈 的 策略 式 描述 。 

定义 5.1( 策 略 型 贝 叶 斯 博弈 ) 一 个 nn 人 贝 叶 斯 博弈 的 策略 式 描述 包括 : 参与 者 的 
类 型 空间 @1,G2，,… ,On, 行 动 空间 Al ,Az ,…,A ,收益 函数 t1 ,U2，…… ,Un， 以 及 他 们 对 他 
人 类 型 (组 合 ) 的 推断 p1,pz2，…,pau，, 其 中 后 三 者 都 是 类 型 依存 的 。 具 备 上 述 4 个 要 素 , 且 
参与 者 同时 行动 的 博弈 称 作 静 态 贝 叶 斯 博 弃 ,又 称 策略 型 贝 叶 斯 博 弃 ,用 G 二 {01， 
Oz sO Al A2 ,An ul un p11 p22 spn) 表示 。 


分 思考 与 练习 
你 能 利用 上 述 符号 来 描述 海 萨 尼 转 挨 吗 ? 


目前 来 讲 ,我 们 对 博弈 的 分 析 集 中 在 参与 者 的 理性 讨论 和 均衡 求解 上 。 这 点 对 于 贝 
叶 斯 博弈 也 不 例外 。 现 在 我 们 来 谈 如 何 定义 贝 叶 斯 博弈 中 的 均衡 。 前 文 有 关 行 动 和 策略 
的 定义 ,是 将 纳什 均衡 的 概念 扩展 到 此 处 的 基础 。 基 本 思想 与 完全 信息 中 的 纳什 均衡 是 


@ ”此 处 的 同 分 布 是 指 遍历 不 同 的 统计 样本 .而 非 遍历 博弈 的 参与 者 。 
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一 样 的 : 每 个 参与 者 的 策略 必须 是 对 其 他 参与 者 策略 (或 策略 组 合 ) 的 最 佳 反应 ,都 没有 
动机 单方 面 偏离 。 但 是 此 处 仍然 存在 一 个 问题 : 不 完全 信息 下 策略 是 类 型 依存 的 ,该 如 
何 体现 ? 因此 ,定义 一 个 策略 组 合 是 贝 叶 斯 博弈 的 均 衔 , 需 解决 两 个 重要 问题 : 类 型 对 
策略 的 影响 ; @@ 如 何 推 断 一 个 参与 者 的 类 型 。 

首先 ,类 型 的 影响 。 在 任何 给 定 的 博弈 中 ,每 个 参与 者 都 知道 自然 所 赋予 自己 的 类 
型 ,并 且 他 无 须 考虑 在 其 他 类 型 下 自己 将 怎样 做 。 因 此 ,每 个 参与 者 可 能 会 想到 仅仅 针对 
自己 的 类 型 来 定义 均衡 就 足够 了 。 现 实 并 非 如 此 。 他 必须 考虑 别人 的 应 对 策略 : 在 所 有 
可 能 类 型 下 别人 将 分 别 做 何 反 应 。 其 主要 原因 在 于 : 别人 不 了 解 参 与 者 的 类 型 ,因此 会 
针对 参与 者 的 所 有 可 能 类 型 来 评估 自己 将 要 如 何 应 对 。 所 以 ,又 回 到 起 点 ,这 个 参与 者 在 
任 一 给 定 类 型 下 的 行动 ,将 依赖 于 自己 在 其 他 类 型 下 的 行动 。 换 言 之 ,参与 者 要 想 针 对 他 
人 的 策略 做 出 最 优 决策 ,必须 预测 他 人 将 如 何 行动 ,而 他 人 的 行动 又 依赖 于 自己 在 其 他 类 
型 下 的 最 优 行动 。 因 此 ,参与 者 不 仅 需 要 考虑 自己 在 当前 类 型 下 的 最 优 行动 ,还 要 考虑 在 
其 他 可 能 类 型 下 的 最 优 行动 。 所 以 . 仅 针对 参与 者 的 当前 类 型 来 定义 均衡 是 不 符合 理性 
的 ,还 需要 考虑 自己 在 其 他 可 能 类 型 下 的 行动 。 回 头 看 策略 和 行动 的 定义 ,你 会 发 现 策略 
之 所 以 考虑 所 有 的 可 能 类 型 ,是 因为 定义 均衡 的 需要 。 

其 次 ,是 关于 推断 的 , 亦 称 信念 。 此 处 借助 符号 说 明 可 能 更 易 理 解 。 在 贝 叶 斯 均衡 
中 ,参与 者 i 只 知道 类 型 为 0; 的 参与 者 j 将 选择 aj(0;) .但 却 不 知道 0 的 具体 值 。 因 此 ， 
即使 纯 策略 选择 也 必须 计算 支付 函数 的 期 望 值 。 但 如 同 纳 什 均 衡 一 样 , 贝 叶 斯 均衡 在 本 
质 上 是 一 个 一 致 性 预测 , 即 每 个 参与 者 i 都 能 正确 地 预测 到 参与 者 j 在 类 型 0; 下 的 最 优 
选择 是 aj (0; )。 因 此 ,参与 者 i 对 其 他 参与 者 的 具体 类 型 会 形成 一 个 推断 , 即 参与 者 ; 的 
信念 pi(0-i10;)。 但 是 参与 者 i 对 于 参与 者 j 的 信念 pj; 的 信念 不 宜 再 进入 均衡 的 定义 。 
在 均衡 中 ,唯一 重要 的 是 参与 者 i 自己 的 信念 p; 和 其 他 参与 者 的 行动 a-;(0-;)。 不 过 ， 
这 也 仅 限 于 静态 贝 叶 斯 博弈 。 在 不 完全 信息 动态 博弈 中 ,参与 者 有 关 其 他 参与 者 的 信念 
是 重要 的 ,因为 此 时 一 个 参与 者 可 以 通过 观测 其 他 参与 者 的 行动 来 修正 信念 或 其 他 参与 
者 的 类 型 。 更 多 内 容 可 参见 下 一 小 节 中 有 关 信 念 的 讨论 。 

至 此 ,我 们 已 经 能 够 利用 文字 对 贝 叶 斯 纳什 均衡 给 出 粗略 的 描述 了 。 

定义 5.2( 贝 叶 斯 纳什 均衡 ) 在 策略 式 贝 叶 斯 博弈 中 ,如 果 一 个 策略 组 合 满足 以 下 
条 件 , 则 称 该 策略 组 合 为 贝 叶 斯 纳什 均衡 。 

(1) 假定 其 他 人 的 策略 不 变 , 任 给 一 个 参与 者 的 类 型 ,在 该 策略 组 合 中 与 此 类 型 所 对 
应 的 行动 是 他 的 最 优 行动 一 一 评判 准则 是 使 每 个 参与 者 在 其 信念 下 的 期 望 效 用 最 大 化 。 

(2) 对 于 任意 参与 者 的 所 有 可 能 类 型 ,都 满足 条 件 (1)。 

欲 使 所 有 参与 者 的 策略 组 合 构成 一 个 贝 叶 斯 纳什 均衡 ,可 对 每 个 参与 者 的 策略 进行 
考察 。 对 任 一 参与 者 的 所 有 类 型 来 讲 , 他 的 策略 都 必须 是 最 优 策略 。 换 言 之 ,对 参与 者 的 
每 个 类 型 来 说 ,他 所 采取 的 行动 都 是 最 优 行动 。 因 此 , 想 要 判断 一 个 参与 者 的 策略 是 否 最 
优 , 就 必须 对 他 的 所 有 类 型 进行 检验 。 


WW 进 阶 阅读 : 贝 叶 斯 纳什 均衡 的 正式 定义 
在 贝 叶 斯 博弈 G 中 ,策略 组 合 s* 一 (Sr ,ss ) 是 贝 叶 斯 纳什 均衡 的 条 件 为 : 如果 


170 博弈 论 入 门 


对 任何 参与 者 i 和 他 的 每 一 种 可 能 的 类 型 0i ,该 策略 下 所 选择 的 行动 ui 都 能 满足 
Ee 2 {uiLs? (01) ,°° ss 1 (0:1) sais si (O11) ,ess (0n); 0:]pi(0-i|0)}o 
Eh; 人 


亦 即 ,在 给 定 其 他 参与 者 策略 的 情况 下 ,没有 参与 者 愿意 改变 自己 的 策略 ,即使 这 种 改变 
只 涉及 一 种 类 型 下 的 一 种 行动 。 


5.2.3 关于 贝 叶 斯 博弈 的 补充 * 


对 不 完全 信息 博弈 的 分 析 可 能 是 个 新 鲜 而 有 趣 的 过 程 。 它 既 承 接 了 之 前 的 均衡 概念 
和 分 析 方 法 ,又 在 此 基础 上 派生 出 更 多 内 容 。 在 对 不 完全 信息 的 分 析 过 程 中 , 海 萨 尼 转换 
是 将 不 完全 信息 转化 成 完全 信息 的 关键 一 步 。 为 了 更 深入 地 理解 海 萨 尼 转 换 和 贝 叶 斯 博 
弈 ,本 小 节 继 续 围绕 贝 叶 斯 博弈 的 基础 问题 进行 补充 说 明 。 对 于 初学 者 ,本 小 节 有 一 定 难 
度 ,笔者 将 尽量 使 用 通俗 的 语言 进行 冰释。 首先 讨论 关于 海 萨 尼 转 换 的 前 提 性 假定 ,其 次 
是 均衡 的 多 样 性 和 均衡 的 精炼 ,最 后 涉及 信念 的 赋予 。 

1. 海 萨 尼 转换 的 假设 

回顾 前 几 章 ,具有 完全 信息 的 参与 者 知道 所 有 那些 未 完全 被 博弈 规则 排除 在 外 的 信 
息 。 实 际 上 ,关于 暗含 在 完全 信息 纳什 均衡 中 的 理性 ,有 5 个 主要 的 假定 : 参与 者 完全 
了 解 博弈 规则 ; @ 参 与 者 完全 了 解 每 个 参与 者 的 特征 ; 四 参与 者 都 按照 贝 叶 斯 法 则 行 
动 , 即 所 谓 的 “ 贝 叶 斯 理性 ”; @ 参 与 者 能 够 复制 别人 的 推理 , 即 “ 我 知道 ,你 知道 我 知 
道 …… ”; @ 参 与 者 的 理性 是 共同 知识 。 根 据 海 萨 尼 的 观点 ,最 根本 的 假定 是 第 二 个 , 因 
为 博弈 规则 的 不 确定 性 实际 上 可 以 表述 为 得 益 的 不 确定 性 。 于 是 ,不 完全 信息 博弈 着 重 
探讨 的 是 第 二 个 假定 缺失 时 的 情境 。 换 言 之 , 贝 叶 斯 博弈 不 仅 可 用 于 每 个 参与 者 不 确 知 
别人 得 益 的 情形 ,还 可 应 用 于 每 个 参与 者 不 确 知 别人 特征 的 情形 。 实 际 上 ,大 多 数 关于 贝 
叶 斯 博弈 的 建 模 和 均衡 求解 都 是 在 拓展 纳什 均衡 ,以 及 为 扩展 提供 便利 的 条 件 。 

上 文 已 经 提 及 ,信息 的 不 完全 可 以 表述 为 事件 的 不 确定 。 但 是 , 仅 当 所 有 不 确定 事件 
都 被 赋予 概率 值 的 条 件 下 ,才能 够 定义 和 计算 参与 者 的 期 望 效用 。 无 疑 , 这 种 精确 性 便利 
了 均衡 求解 ,但 它 是 否 也 限制 了 海 萨 尼 转 换 的 适用 范围 , 意 即 海 萨 尼 转换 只 适用 于 概率 分 
布 已 知 的 情况 ?实际 上 ,弗兰克 。 普 伦 普 顿 。 拉 姆 齐 (Frank Plumpton Ramsey) 和 伦 纳 
德 。 吉 米 ， 萨 维 奇 (Leonard Jimmie Savage) 已 经 证 明 , 即 使 某 些 事件 不 能 被 指定 客观 概 
率 值 ,一 个 理性 的 决策 者 也 应 该 能 够 确定 其 主观 概率 值 ,以 便 计 算 期 望 值 。 因 此 ,在 更 为 
宽泛 的 条 件 下 主观 感知 也 可 以 进入 概率 测度 。 这 大 大 提高 了 海 萨 尼 转换 的 普 适 性 。 同 时 
它 也 可 能 会 导致 新 的 问题 : 如 果 各 个 参与 者 对 同一 事件 的 主观 感知 概率 不 同 , 那 么 各 个 
参与 者 对 别人 的 行为 预测 就 会 出 现 偏差 ,此 时 该 如 何 保证 均衡 预测 的 一 致 性 呢 ? 

海 萨 尼 转换 假定 每 个 参与 者 的 先 验 概 率 都 是 一 样 的 。 它 认为 参与 者 拥有 知识 的 不 同 
都 可 由 参与 者 所 处 的 外 在 客观 机 制导 出 ,而 不 是 来 源 于 参与 者 初始 信念 的 差异 。 换 言 之 ， 
它 假定 这 种 分 布 是 所 有 参与 者 的 共同 知识 ,因而 对 参与 者 特征 的 茫然 无 知 便 可 解析 地 获 


@ 在 类 型 4 下 的 策略 sz (8) 就 是 行动 a;。 
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得 。 不 仅 如 此 ,关于 先 验 概率 的 共同 知识 对 参与 者 后 验 概率 间 的 关系 具有 较 强 的 含义 ,这 
一 点 只 有 在 学 习 了 动态 贝 叶 斯 博弈 之 后 才能 深刻 体会 。 

2. 均衡 的 多 样 性 与 精炼 

为 了 更 好 地 理解 均衡 概念 ,不妨 将 视野 放宽 ,延伸 至 动态 贝 叶 斯 博弈 中 的 情况 。 

我 们 已 经 知道 ,即使 在 每 一 阶段 结束 时 参与 者 都 能 观察 到 别人 的 行动 , 子 博弈 完美 在 
此 处 仍然 是 不 起 作用 的 。 由 于 参与 者 可 能 不 知道 别人 的 类 型 ,所 以 从 某 一 阶段 开始 之 后 
的 “ 子 博弈 ”并 不 能 构成 一 个 完整 意义 的 子 博弈 一 一 除非 已 经 给 定 了 参与 者 的 后 验 信念 。 
因此 ,在 博弈 进行 到 某 一 阶段 时 ,我 们 无 法 检验 后 续 的 策略 组 合 是 否 为 子 博弈 完美 的 。 事 
实 上 ,不 完全 信息 的 适当 子 博弈 就 是 整个 博弈 ,所 以 任何 纳什 均衡 都 是 子 博 弈 完美 的 。 因 
而 ,如 果 直 接 采 用 纳什 均衡 ,将 会 出 现 多 重 均衡 ,其 中 不 乏 那 些 经 不 起 实践 检验 的 均衡 。 
关于 这 一 点 ,我们 在 第 3 章 尝 试 采 用 纳什 均衡 概念 时 曾 有 过 类 似 的 结果 。 

由 于 均衡 多 样 性 是 贝 叶 斯 博弈 的 一 个 显著 特征 ,为 了 删 掉 那些 不 合理 的 均衡 , 仍 需 对 
它们 进行 精炼 , 即 重复 剔除 弱 占 优 策略 。 这 是 一 个 非常 具有 挑战 性 的 问题 ,因为 在 不 完全 
信息 下 子 博 弈 完美 的 概念 堂 不 适用 。 事 实 上 ,针对 贝 叶 斯 博弈 的 均 衔 概念 所 提出 的 精炼 
方法 不 止 一 种 ,这 些 精炼 方法 代表 了 人 们 力图 把 直觉 正规 化 的 努力 。 在 均衡 的 精炼 过 程 
中 ,北向 归纳 和 正 向 归纳 是 在 不 同 规范 背景 下 出 现 的 两 种 伟大 的 “策略 稳定 性 ”原则 一 一 
兼 以 使 用 "重复 剔除 弱 占 优 ?方法 。 一 个 均衡 ,不 仅 要 和 对 手 们 面向 未 来 时 所 做 的 推断 相 
一 致 (逆向 归纳 ), 而 且 要 和 对 手 们 在 过 去 事实 基础 上 所 做 的 推断 相 一 致 ( 正 向 归纳 )。 后 
者 表示 参与 者 可 以 通过 不 断 调 整 自己 的 行动 来 达到 一 个 均衡 一 一 它 反映 了 不 具备 足够 远 
见 的 主体 在 多 次 重复 博弈 中 的 学 习 纠 偏 ( 事 后 的 ), 而 不 是 参与 者 之 间 的 交叉 预期 (事前 
的 )。 但 是 从 理论 分 析 的 角度 讲 ,兼顾 两 种 方向 相反 的 原则 确实 存在 很 大 难度 一 一 至 少 就 
目前 的 知识 来 看 如 此 。 逆 向 归纳 已 被 反复 提 及 ,而 正 向 归纳 的 思想 将 在 第 7 章 中 介绍 。 

既然 需要 对 动态 贝 叶 斯 博弈 中 存在 的 所 谓 “ 均 衡 " 进 行 精炼 ,那么 研究 者 们 就 开始 尝 
试 不 同 的 精炼 思路 ,并 提出 了 多 种 均衡 概念 ,其 中 包括 闸 拌 手 完美 均衡 序列 均衡 和 完美 
贝 叶 斯 均衡 等 。 人 们 曾 将 子 博弈 完美 性 、 贝 叶 斯 纳什 均衡 以 及 贝 叶 斯 推论 的 思想 综合 起 
来 ,形成 了 完美 贝 叶 斯 均衡 的 概念 。 这 个 概念 最 早 见 于 朱 ， 弗 登 们 格 (Drew Fudenberg) 
和 让 ， 梯 若 尔 (1991) ,其 中 贝 叶 斯 推论 是 指 : 给 定 参与 者 的 后 验 概率 ,要 求 策略 在 每 一 个 
后 续 博 弈 中 都 能 产生 一 个 贝 叶 斯 均衡 ,并 且 要 求 只 要 贝 叶 斯 法 则 适用 ,信念 就 应 该 根据 由 


叶 斯 法 则 加 以 更 新 。 序 贯 均衡 也 是 类 似 的 思想 ,但 它 对 于 参与 者 更 新 信念 的 方式 施加 了 
更 多 的 限制 。 这 些 概 念 仅 做 简介 , 感 兴趣 的 读者 可 参阅 相关 书目 。 
3. 信念 的 赋予 


在 介绍 武林 大 战 和 海 萨 尼 转换 时 ,也 许 你 会 有 如 此 疑问 : 这 个 信念 是 怎么 来 的 ? 换 
言 之 , 赁 什么 推断 类 型 1 和 类 型 2 的 概率 均 为 0. 5 ,而 不 是 分 别 为 0.6 和 0.4。 要 回答 这 
个 问题 ,必须 回顾 概率 论 中 的 两 个 重要 概念 一 一 先 验 概率 和 后 验 概率 。 先 验 概率 是 指 根 
据 以 往 的 经 验 数 据 或 逻辑 分 析 而 得 到 的 概率 ; 而 后 验 概率 则 可 被 理解 为 条 件 概 率 ,是 指 
借 由 某 一 事件 的 发 生 而 推断 另 一 事件 发 生 的 可 能 性 。 

此 处 讨论 先 验 和 后 验 ,是 因为 某 些 行动 的 信息 可 能 会 影响 到 参与 者 的 信念 ,这 将 在 后 
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文 的 模型 中 看 到 。 为 了 更 好 地 理解 后 文 , 建 议 读 者 在 此 多 花 些 时 间 。 在 参与 者 类 型 相互 
独立 时 ,自然 "所 赋予 的 概率 一 般 是 先 验 的 一 一 这 个 概率 主要 基于 以 往 的 生活 经 验 或 数 
据 。 但 是 当 参 与 者 类 型 相关 或 有 其 他 信号 影响 时 ,参与 者 的 信念 将 是 后 验 的 , 需 满足 贝 叶 
斯 理性 。 

关于 信念 的 赋予 ,有 两 个 问题 需要 回答 : 四 所 赋予 的 信念 包含 哪些 内 容 ? 四 信念 是 
怎样 被 赋予 的 ? 

回顾 本 节 开 头 , 在 对 武林 大 战 做 海 萨 尼 转 换 时 ,是 否 只 有 盟主 知道 类 型 1、2 的 概率 分 
布 ? 答案 是 否定 的 。 这 个 信息 是 共同 知识 。 不 仅 盟 主 ,隐士 也 知道 嚼 主 对 自己 类 型 分 布 
的 信念 一 一 请 注意 隐士 还 知道 自己 的 准确 类 型 。 此 处 所 说 的 信念 主要 指 某 一 参与 者 对 其 
他 参与 者 类 型 的 概率 分 布 所 持 有 的 推断 。 关 于 信念 是 如 何 被 赋予 参与 者 的 ,一 种 简单 的 
解释 是 “由 自然 决定 的 ”, 参 与 者 通过 客观 一 致 的 渠道 获得 这 种 信念 。 如 在 第 2 章 中 的 混 
合 策略 均衡 中 , 当 一 个 足球 守门 员 面 对 格 罗 索 的 点 球 时 ,他 的 团队 可 以 告诉 他 罗 格 罗 索 点 
球 的 历史 数据 一 一 这 种 统计 通常 由 专业 数据 提供 商 提供 ,如 OPTA 和 STATS 等 。 然 
而 ,并 不 是 所 有 的 信念 都 能 以 这 种 方式 赋予 参与 者 。 在 缺乏 客观 数据 时 自然 选择 更 多 地 
依赖 于 参与 者 的 主观 感知 和 学 习 。 那 么 , 当 参 与 者 对 类 型 分 布 的 感知 主要 来 自 经 验 习 得 
而 非 客观 事实 时 ,这 种 信念 是 如 何 形成 的 呢 ? 仍 以 武林 大 战 为 例 。 假 如 盟主 佩戴 着 "007” 
的 高 科技 眼镜 ,镜片 显示 会 告诉 他 : 请 注意 ,高 手 概率 是 50%! 事实 上 ,武侠 小 说 中 的 盟 
主 没有 类 似 装 备 ,推断 完全 赁 直觉 。 一 个 曾 接连 5 次 遇 到 高 手 的 盟主 与 一 个 接连 5 次 遇 
见 术士 的 盟主 似乎 更 有 可 能 拥有 不 同 的 信念 一 -即便 在 客观 上 遇 到 高 手 的 概率 都 
是 0.5。 

另外 ,假定 隐士 心里 也 有 一 杆 秤 ,他 认为 盟主 对 自己 类 型 的 推断 为 : 类 型 1 的 概率 是 
0.4, 类 型 2 的 概率 是 0.6。 一 般 情况 下 ,前 文 所 得 到 的 策略 对 隐士 来 讲 不 是 最 优 的 。 换 
句 话说 ,隐士 能 够 通过 改变 自己 的 行动 来 迎合 盟主 对 自己 的 判断 ,从 而 获取 更 多 得 益 。 但 
是 提请 读者 注意 ,此 时 的 问题 出 在 隐士 的 信念 上 ,严格 来 讲 是 他 所 感知 的 盟主 对 自己 类 型 
的 判断 上 ,而 非 他 的 理性 上 。 正 如 前 文 提 及 的 空城 计 , 子 元 输 在 自己 的 信念 与 实际 不 符 ， 
而 非 自己 的 推理 错误 或 完全 没 想 到 。 因 此 ,隐士 需要 修正 自己 的 信念 以 便 与 实际 相符 。 
作为 反应 ,盟主 也 会 调整 自己 的 策略 。 这 样 经 过 多 次 重复 博弈 之 后 ,双方 对 于 隐士 类 型 的 
信念 将 会 逐渐 统一 ,成 为 共同 知识 。 此 时 ,双方 的 策略 都 将 是 最 优 的 。 在 给 定 对 方 策略 不 
变 的 情况 下 ,双方 都 没有 动机 偏离 ,此 即 均衡 。 同 时 , 随 着 博弈 经 历 的 增加 ,参与 者 的 信念 
将 会 动态 更 新 。 关 于 信念 的 更 新 ,请 参见 第 5. 6.3 和 6. 3.2 节 。 


5.3 密封 拍卖 : 启 者 的 诅 史 和 真实 出 价 
在 前 文 所 介绍 的 博弈 中 ,只 有 一 个 参与 者 拥有 私人 信息 。 例 如 ,在 武林 大 战 博 蛮 中 只 


有 隐士 具有 私有 信息 ,而 盟主 则 不 然 。 接 下 来 将 介绍 更 一 般 的 情景 : 每 个 参与 者 都 拥有 
私人 信息 。 关 于 这 种 情景 ,一 个 典型 的 例子 就 是 拍卖 。 
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拍卖 ,作为 一 种 资源 分 配 机 制 ,应 用 十 分 广泛 。 同 时 ,拍卖 也 是 博弈 论 在 机 制 设计 方 
面 的 一 个 重要 领地 。 通 常 被 拍卖 的 物品 既 包括 收藏 品 ` 房 屋 ` 二 手 商品 ` 农 产品 等 有 形 资 
产 ,也 包括 诸如 土地 使 用 权 、 工 程 建设 标的 、 矿 产 开采 权 、 通 信 频 谱 等 无 形 资产 。 而 关于 拍 
卖 的 研究 则 主要 针对 估价 的 私密 性 、 拍 卖 的 公平 和 效率 等 问题 进行 细 化 与 必要 的 假设 , 建 
立 不 完全 信息 博弈 模型 ,并 据 此 分 析 参 与 者 的 出 价 策略 以 及 给 定 的 拍卖 机 制 。 

简 言 之 ,拍卖 有 多 种 形式 (或 称 机 制 ) ,不 同 的 拍卖 形式 对 应 着 不 同 的 博弈 模型 和 结 
果 。 常 用 的 拍卖 可 简单 归结 为 4 种 基本 形式 : 首 价 密封 拍卖 .二 价 密封 拍卖 .公开 增 价 拍 
卖 和 公开 降价 拍卖 。 本 章 主 要 通过 首 价 密封 拍卖 和 二 价 密封 拍卖 来 介绍 不 完全 信息 博弈 
的 相关 概念 。 有 一 点 需要 向 读者 做 出 说 明 。 在 接 下 来 的 分 析 中 ,我 们 首先 侧重 介绍 均衡 。 
在 读者 掌握 了 如 何 分 析 均 衡 之 后 ,再 慢 慢 地 介绍 如 何 建立 和 更 新 信念 。 


5.3.1 首 价 密封 拍卖 
2 引 语 故事 :“ 地 王 ” 的 诞生 


2015 年 9 月 23 日 上 海 的 土地 拍卖 现场 ,金地 集团 以 20.133 6 亿 元 竞 得 嘉定 区 嘉定 
新 城 E26-1 地 块 , 溢 价 率 96. 63% ,成 交 楼 板 价 1. 86 万 元 /平方 米 。 

该 价格 刷新 了 上 述 区 域 地 价 , 值 得 一 提 的 是 该 地 块 也 成 为 上 海 首 宗 以 “ 瞳 标 ”形式 讶 
生 的 总 价 地 王 。 在 土地 竞拍 现场 ,每 家 开发 商 只 能 以 书面 表格 的 形式 进行 一 次 报价 ,据悉 
“金地 ” 比 第 二 高 开发 商 报价 高 出 7000 多 万 元 。 从 以 往 的 历史 情况 看 ,通过 “ 暗 标 ”拍卖 
很 少 出 现 如 此 高 溢价 的 情况 .了 

根据 开标 结果 ,16 家 竞标 企业 的 报价 如 表 5-1 所 示 。@ 

表 5-1 参与 拍卖 的 16 家 房 企 报价 单 


房 企 编号 报价 /万 元 房 企 编号 报价 /万 元 
1 173 049 9 167 200 
2 108 000 10 178 899 
3 167 000 11 167 393 
4 151 000 12 121 393 
5 161 888 13( 金 地 ) 201 336 
6 149 600 14 172 600 
7 173 593 15 146 033 
8 177 009 16 194 100 


上 面 引 语 故 事 中 的 “ 瞳 标 ”, 意 即 密 封 投标 ,出 价 最 高 者 将 以 最 高 出 价 获得 标的 。 这 种 
拍卖 形式 就 是 本 小 节 所 要 介绍 的 首 价 密封 拍卖 。 它 是 一 种 常见 的 拍卖 形式 ,而 且 可 能 会 
带 来 一 个 典型 现象 : 赢 者 的 诅咒 。 在 首 价 密封 拍卖 中 ,所 有 竞价 参与 者 都 将 各 自 所 愿意 


@ 资料 来 源 : 中 国 新 闻 网 ,http://www. chinanews. com/house/2015/09-24/7541077. shtml,2015-09-24. 
回 ”资料 来 源 : 搜房 网 ,http://news. sh. fang. com/2015-09-23/17472916. htm,2015-09-23. 
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出 的 交易 价格 写 进 一 个 密封 的 “信封 称 作 出 价 或 叫价 )。 信 封 泛 指 一 切 能 够 对 所 传递 内 
容 进行 封闭 的 载体 ,如 在 线 拍卖 时 附 有 数字 签名 和 非 对 称 加 密 的 数据 包 。 当 所 有 人 把 信 
封 上 交 后 ,拍卖 发 起 者 便当 众 打 开 所 有 密封 的 信封 ,将 商品 出 售 给 出 价 最 高 的 人 。 出 价 最 
高 的 竞价 者 将 以 最 高 出 价 购买 该 标的 。 

一 般 来 讲 , 参 与 拍卖 的 每 个 买 家 对 拍卖 品 都 有 自己 的 估价 。 这 种 估价 依赖 于 每 个 参 
与 者 的 自身 特征 ,进而 影响 参与 者 的 出 价 。 卖 方 不 知道 买方 的 估价 ,每 个 买方 也 不 知道 其 
他 买方 的 估价 。 这 作为 私有 信息 存在 于 每 一 个 参与 者 心中 。 这 类 估价 有 如 下 两 个 特点 : 
估价 因 人 而 蜡 , 即 * 千 人 千 价 ” @ 唯 一 知道 该 估价 的 人 只 有 他 自己 。 

提请 读者 注意 ,这 里 的 估价 是 竞价 者 对 拍卖 品 真正 价值 的 一 个 估计 。 它 既 不 是 物品 
的 真正 价值 ,也 不 是 竞价 者 的 出 价 。 显 然 ,竞价 者 的 出 价 一 定 不 会 超过 他 的 估价 , 即 他 所 
愿意 付出 的 最 高 价 。 但 是 仍然 存在 一 个 问题 : 在 此 上 限 之 内 ,应 该 出 价 高 一 点 儿 还 是 低 
一 点 儿 呢 ? 若 出 价 高 一 点 儿 , 更 有 可 能 赢得 标的 ,但 对 应 获 利 却 更 少 。 反 之 ,赢得 标的 的 
可 能 性 低 , 但 对 应 获 利 却 更 多 。 所 以 ,竞价 者 需要 在 高 低 之 间 权 衡 。 由 于 不 知道 其 他 投标 
者 的 估价 ,竞价 者 需要 建立 自己 的 判断 。 如 果 没 有 信息 不 对 称 , 那 么 结论 非常 简单 。 例 
如 ,在 两 人 竞价 时 若 一方 已 知 另 一 方 的 估价 为 5 元 ,那么 他 出 价 5. 1 元 即 可 中 标 。 问 题 恰 
恰 在 于 竞价 者 之 间 的 信息 不 对 称 。 它 使 得 竞价 者 必须 对 其 他 竞价 者 的 估价 进行 推断 并 由 
此 形成 相对 复杂 的 策略 。 和 否则 ,竞价 者 的 出 价 将 会 脱节 ,可 能 导致 中 标 者 出 价 奇 高 。 例 
如 ,在 1996 年 中 央 电 视 台 广告 时 段 的 招标 中 ,山东 秦 池 酒 厂 以 3. 2 亿 元 的 报价 夺 得 “ 标 
王 ”。 但 是 次 高 的 出 价 只 有 1. 6 亿 元 ,是 秦 池 出 价 的 一 半 。 试 想 一 下 ,如 果 秦 池 事 先知 晓 
对 手 的 估价 和 出 价 策略 ,那么 他 只 需 出 价 比 1.6 亿 元 多 一 点 儿 即 可 。 因 此 , 当 各 个 参与 者 
都 拥有 自己 的 私人 信息 时 ,博弈 的 难度 也 加 大 了 。 那 么 ,该 从 哪里 入 手 加 以 分 析 ? 接 下 来 
将 结合 拍卖 实例 讲解 。 

考虑 到 读者 数学 基础 的 差别 ,本 书 先 采 用 具体 数字 来 分 析 , 然 后 再 引入 符号 推理 。 

1. 当 物 品 是 私有 价值 时 

简单 起 见 ,假设 拍卖 物品 具有 独立 私有 价值 2?。 在 此 类 拍卖 中 ,拍卖 品 的 价值 对 于 所 
有 竞价 者 都 是 私有 的 。 每 个 竞价 者 都 对 该 物品 有 着 自己 的 估价 ,但 是 却 不 能 从 其 他 竞价 
者 的 估价 中 得 到 对 自己 估价 有 用 的 信息 。 如 果 将 估价 视 为 竞价 者 的 类 型 , 则 竞价 者 的 类 
型 是 统计 独立 的 。 总 之 ,竞价 人 关于 拍卖 品 的 估价 是 其 私有 信息 ,但 是 “拍卖 品 具 有 独立 
私有 价值 "这 一 点 却 是 共同 知识 。 

如 前 所 述 ,每 个 竞价 者 所 拥有 的 估价 都 是 和 有 信息 。 因 此 ,竞价 者 之 间 可 用 各 自 的 佑 
价 来 加 以 区 别 ,也 就 是 竞价 者 的 类 型 。 简 单 起 见 , 假 设 只 有 两 人 竞价 ', 则 存在 两 种 可 能 类 
型 : (a,b)。 进 一 步 , 令 


@ 与 独立 私有 价值 相对 的 另 一 个 常见 假设 是 共同 价值 (common value)。 在 共同 价值 模型 中 ,拍卖 品 的 真正 价 
值 对 所 有 投标 人 都 是 相同 的 ,但 投标 人 都 不 知道 其 真正 价值 的 大 小 , 即 在 投标 时 共同 价值 是 未 知 的 。 然 而 ,每 个 人 都 
有 自己 对 拍卖 品 的 估价 ,并 且 这 个 估价 只 有 他 自己 知道 。 一般 来 讲 , 收 藏品 ,艺术 品 拍卖 适用 于 独立 私有 价值 模型 ,而 
工程 建设 .矿产 开发 等 更 适用 于 共同 价值 模型 。 详 见 村 黎 和 胡 奇 英 等 翻译 的 (拍卖 理论 与 实务 ) 等 。 
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a: 估价 50 元 ,概率 为 0. 6。 

b: 估价 100 元 ,概率 为 0. 4。 

不 难 推 知 ,竞价 者 的 最 终 获 利 与 是 否 赢 得 标的 有 关 。 如 果 胜 出 , 则 获 利 是 他 的 估价 减 
去 他 的 出 价 , 反 之 获 利 为 零 。 虽 然 如 此 ,问题 还 不 够 简化 。 为 了 避免 引入 连续 变量 以 及 随 
之 而 来 的 微 积 分 知识 ,本 书 将 出 价 也 离散 化 。 特 别 规定 每 隔 10 元 作为 一 个 可 能 出 价 , 也 
就 是 说 每 个 参与 者 的 策略 是 离散 的 ,分 别 为 10,20,30,…。 

将 博弈 模型 明确 如 下 。 

博弈 参与 者 : 索 斯 比 , 佳 士 得 。 

自然 赋 了 予 的 类 型 : (a,b) ,其 中 

a: 估价 50, 概 率 为 0.6; b: 估价 100 ,概率 为 0.4。 

行动 : 

出 价 10,20,30,…; 递增 幅度 为 10。 

得 益 : 如 果 中 标 , 得 益 二 估价 出 价 ; 否则 ,得 益 二 0。 

附加 判定 : 若 出 价 相同 , 则 抛 硬币 决定 谁 来 购买 (有 一 半 的 机 会 中 标 ) 。 

此 博弈 的 贝 叶 斯 纳什 均衡 求解 过 程 比较 复杂 。 我 们 不 妨 换 一 种 思路 : 证 明 一 个 给 定 
的 策略 组 合 是 贝 叶 斯 纳什 均衡 。 现 在 考察 如 下 的 策略 : 

{ 如 果 估 价 50 就 出 价 40; 如 果 估 价 100 就 出 价 60} 

进一步 ,考虑 由 该 策略 所 构成 的 一 个 对 称 策略 组 合 , 即 双方 都 采用 该 策略 。 那 么 它 是 
一 个 贝 叶 斯 纳什 均衡 吗 ? 现 利用 贝 叶 斯 纳什 均衡 所 应 满足 的 条 件 证 明之 。 不 妨 以 索 斯 比 
的 视角 进行 分 析 。 假 定 索 斯 比 认 为 佳 士 得 的 出 价 可 能 是 40 和 60, 发 生 概率 分 别 为 60% 
和 40% 。 现 在 分 析 索 斯 比 的 策略 。 

首先 ,如 果 索 斯 比 估价 50, 则 出 价 40。 此 时 若 佳 士 得 也 出 价 40, 抛 硬币 可 知 索 斯 比 
有 50% 的 可 能 性 获 中 。 若 佳 士 得 出 价 60, 则 索 斯 比 不 能 赢得 标的 。 因 此 , 索 斯 比 的 期 望 
得 益 为 0.6X0.5X(50 一 40) 十 0.4X0=3。 式 中 的 因子 0. 5 代表 猜 硬币 获胜 的 概率 。 假 
设 索 斯 比 在 估价 50 的 情况 下 调整 出 价 ,让 我 们 来 看 他 是 否 能 增加 自身 的 期 望 得 益 。 其 他 
出 价 所 对 应 的 期 望 得 益 如 表 5-2 所 示 。 


表 5-2 索 斯 比 估价 50 时 的 出 价 和 得 益 


出 价 10 20 30 40 50 60 70 80 


显然 对 于 索 斯 比 来 讲 , 出 价 40 是 在 估价 50 时 的 最 优 策略 ,这 符合 贝 叶 斯 纳什 策略 的 
条 件 。 直 观 地 思考 ,这 个 结果 也 是 很 显然 的 。 因 为 当 出 价 小 于 40 时 ,根本 不 可 能 胜出 ,得 
益 为 0, 当 出 价 高 于 40 时 ,至 少 出 价 50 ,而 本 身 对 商品 的 估计 仅 有 50 ,所 以 大 于 50 的 策略 
的 得 益 总 会 小 于 0。 因 此 ,对 这 一 部 分 的 检验 正确 。 

其 次 ,如 果 索 斯 比 估价 100, 则 出 价 60。 相 应 地 , 佳 士 得 也 有 60% 的 概率 出 价 40 和 
40% 的 概率 出 价 60。 此 时 期 望 得 益 为 0. 6X (100 一 60) 十 0. 4X0.5X(100 一 60) 二 32。 
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同 理 , 在 索 斯 比 估 价 100 的 条 件 下 其 他 出 价 所 对 应 的 期 望 得 益 如 表 5-3 所 示 。 
表 5-3 索 斯 比 估价 100 时 的 出 价 和 得 益 


出 价 “0 30 40 50 60 70 80 90 100 


得 益 “ 0 18 30 32 30 20 10 0 


可 见 , 出 价 60 的 策略 同样 为 最 优 策略 ,因此 这 一 部 分 检验 正确 。 
由 于 博弈 的 对 称 性 ,上 述 推理 同样 适用 于 佳 士 得 。 
因此 ,双方 均 采取 “如果 估价 50 就 出 价 40; 如 果 估 价 100 就 出 价 60” 这 样 一 个 策略 
组 合 是 贝 叶 斯 纳什 均衡 。 事 实 上 ,一 个 贝 叶 斯 博弈 可 能 存在 多 个 贝 叶 斯 纳什 均衡 。 然 而 ， 
针对 一 般 情况 而 讨论 如 何 求解 均衡 非常 困难 ,甚至 是 不 可 能 的 。 因 此 ,我 们 聚焦 于 对 给 定 
均衡 的 验证 而 非 求解 均衡 。 
分 思考 与 练习 

为 什么 此 处 的 不 完全 信息 博弈 是 对 称 博弈 ? 你 能 仿照 前 文 画 出 此 博弈 的 博弈 树 吗 ? 

无 论 你 对 数字 是 否 敏感 ,这 种 均衡 的 定性 结论 都 是 非常 直观 的 。 当 竞价 者 估价 较 低 
时 ,他 会 选择 仅 次 于 估价 的 价格 作为 出 价 , 意 即 他 尽 可 能 花 更 大 的 价钱 ; 而 当 竞 价 者 估价 
较 高 时 ,他 反而 会 隐藏 出 价 ,选择 较为 保守 的 价格 。 这 是 一 个 很 奇特 的 现象 。 对 于 这 样 两 
种 行为 ,都 可 统一 归 因 于 得 益 和 胜出 概率 之 间 的 矛盾 关系 : 想 要 获得 更 高 的 得 益 , 就 必须 
面临 更 大 的 可 能 性 失去 商品 。 为 了 更 明显 地 展示 这 一 对 矛盾 , 表 5-4 给 出 了 索 斯 比 的 胜 
出 概率 和 胜出 时 的 得 益 。 

表 5-4 索 斯 比 估价 100 时 的 中 标 概率 和 中 标 得 益 一 


出 价 “ 30 40 50 60 70 80 90 100 
概率 tt 0 0.3 0.6 0.8 1 1 1 1 
得 益 人 70 60 50 40 30 20 10 0 


分 思考 与 练习 
为 了 给 出 对 比 ,我 们 将 之 前 出 价 40 的 概率 由 0.6 改 为 0.5, 随 之 变动 的 是 出 价 60 的 
概率 改 为 0.5, 请 读者 作为 练习 ,完成 表格 5-5, 并 体会 概率 与 得 益 两 种 因素 相互 制约 的 
现象 。 
表 5-5 索 斯 比 估价 100 时 的 中 标 概率 和 中 标 得 益 二 


出 价 30 40 50 60 70 80 90 100 
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2. 当 物 品 是 共同 价值 时 

从 资源 配置 的 效率 来 讲 , 首 价 密封 拍卖 还 有 提升 的 空间 ,因为 估价 较 高 者 隐藏 出 价 ， 
反而 是 估价 较 低 者 更 愿意 真实 出 价 。 当 然 . 上 述 结论 建立 在 私人 价值 假设 基础 之 上 。 实 
际 上 ,私有 价值 拍卖 大 多 应 用 于 拍卖 艺术 品 .收藏 品 等 ,而 诸如 土地 竞拍 等 情境 则 更 宜 采 
用 共同 价值 拍卖 来 分 析 。 如 果 竞 价 者 的 估价 包含 共同 价值 因素 , 则 他 们 之 间 不 对 称 性 的 
影响 将 会 显著 得 多 。 具 体 而 言 , 在 具有 共同 价值 的 物品 拍卖 中 ,具有 较 高 估价 优势 的 竞价 
者 将 会 出 价 更 大 胆 。 而 这 也 会 更 突出 * 赢 者 的 诅咒 ?所 带 来 的 影响 。 接 下 来 ,本 书 将 通过 
分 析 指 出 共同 价值 拍卖 下 的 ” 赢 者 的 诅咒 "问题 。 


LE 扩展 阅读 : 赢 者 的 诅咒 


有 时 ,你 并 不 能 完全 确定 拍卖 品 的 价值 ,很 有 可 能 高 估 了 拍卖 品 的 价值 。 虽 然 你 赢得 
了 拍卖 品 , 但 后 来 发 现 所 支付 价格 超出 了 物品 的 价值 。 此 时 ,你 已 陷入 " 赢 者 的 诅咒 ”。 

关于 “ 赢 者 的 诅咒 ?的 来 历 , 据 信 出 自古 罗马 帝国 。 传 说 在 公元 193 年 ,当时 的 罗马 皇 
帝 柏 提 那 克 (Pertinax) 被 他 的 禁 卫 军 杀害 ,而 想 捞 一 把 的 禁 卫 军 士兵 对 皇冠 (皇位 ) 进 行 
拍卖 。 一 个 叫 狄 第 乌 斯 (Didius) 的 富 侩 拍 得 皇位 并 承诺 支付 给 每 名 近 卫 军士 兵 25 000 赛 
特 策 (sesterces, 罗马 货币 单位 )。 然 而 皇帝 的 位 置 还 没有 坐 多 久 , 这 位 赢家 便 被 远方 赶 回 
的 罗马 军队 赶 下 了 台 , 并 得 到 了 “* 赢 者 的 诅 儿 ”一 一 被 砍 头 。 从 而 “ 赢 者 的 诅 儿 ”这 个 概念 
被 用 来 指 : 拍卖 的 赢家 成 功 获得 物品 后 发 现 其 价值 低 于 竞拍 出 价 。 

在 其 他 参与 者 对 物品 拥有 更 加 完备 的 信息 时 ,对 一 个 信息 不 够 灵通 的 竞价 者 而 言 , 赢 
得 拍卖 就 是 一 件 更 糟糕 的 事情 。 


现 有 一 块 待 开发 的 住宅 用 地 ,土地 的 可 利用 价值 是 一 个 确定 的 值 , 记 为 *。 由 于 住宅 
用 地 的 价值 更 多 依赖 于 地 块 的 位 置 .周边 设施 和 市 场 预期 ,而 非 个 人 偏好 ,因此 对 所 有 竞 
价 者 而 言 可 谓 共同 价值 。 目 前 有 两 家 公司 红 城 和 蓝海 有 意 去 开采 这 块 土地 。 在 公开 竞标 
之 前 ,两 家 公司 以 各 种 渠道 搜索 关于 未 来 住宅 售 价 总 值 4 的 信息 (如 预期 地 价 、 房 价 等 )。 
但 是 作为 事前 预测 ,两 者 都 不 能 准确 地 估计 》 的 真实 值 ,而 是 或 多 或 少 有 些 偏 差 。 为 了 简 
化 模型 ,假设 估价 仅 有 两 种 可 能 : 
i 概率 为 0. 


4 一 68， 概率 为 0. 

进一步 ,假定 两 种 估价 分 别 发 生 在 两 家 公司 身上 ,其 中 为 一 给 定常 量 。 读 者 可 换 种 方 
式 来 理解 这 种 现象 。 当 竞争 对 手 较 多 时 ,估价 高 低 不 一 。 乐 观 的 估价 相对 较 高 ,悲观 的 反 
之 。 而 土地 的 价值 应 该 居于 市 场 估价 的 平均 水 平 。 所 以 就 某 个 竞价 者 而 言 , 其 估价 有 可 
能 高 了 ,也 有 可 能 低 了 ,而 对 手 的 则 相反 。 总 之 ;不 会 出 现 所 有 的 出 价 都 高 于 平均 值 的 情 
况 。 利 用 海 萨 尼 转 换 ,建立 博弈 如 下 。 

博弈 参与 者 : 红 城 ,蓝海 。 

自然 等 可 能 地 赋予 参与 者 两 种 类 型 : 

( 红 城 估价 较 高 ,蓝海 估价 较 低 ; 红 城 估价 较 低 ,蓝海 估价 较 高 )。 


a 


vi 二 


(i= 1,2) 


a 
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两 种 类 型 的 概率 分 别 为 0.5。 

行动 : 参与 者 的 出 价 ; 简单 计 ,以 任 一 自然 数 作为 出 价 。 

得 益 : 如 果 中 标 , 得 益 二 价值 4 一 出 价 b; 否则 ,得 益 一 0。 

提请 读者 注意 ,此 时 中 标的 得 益 为 物品 的 共同 价值 减 去 出 价 , 而 估价 vi(i 二 1,2) 只 是 
中 间 量 。 估 价 既 是 中 间 量 ,那么 此 处 引入 估价 的 作用 是 什么 呢 ? 它 是 公司 出 价 的 重要 参 
照 ! 公司 将 依照 自己 的 估价 制定 出 价 策略 。 一 般 来 讲 , 每 个 竞价 者 的 出 价 是 其 估价 的 函 
数 。 当 然 ,一 个 简单 易 行 的 策略 就 是 常见 的 线性 出 价 策 略 , 意 即 出 价 是 估价 的 线性 函数 。 
仍然 考虑 对 称 策略 组 合 “ 出 价 6; 二 vi 一 1,i 二 1,2”。 不 妨 令 6 二 2,v1 二 20, 并 从 “ 红 城 ”的 角 
度 展开 分 析 。 

首先 ,任何 大 于 估价 wi 的 出 价 bh 都 不 是 占 优 的 。 因 为 即使 赢得 标的 ,其 得 益 仍然 为 
负 。 与 其 这 样 ,不 如 出 价 为 vi, 此 时 得 益 为 0。 相 比 出 价 磋 二 vi,01 二 v1 一 1 是 一 个 弱 占 优 
策略 , 即 此 时 不 会 获 利 更 少 一 一 只 要 有 一 丝 可 能 获胜 ,就 会 大 于 0。 实际 上 ,和 一刀 一 1 严 
格 优 于 二 vi。 请 读者 自行 证 明之 。 

其 次 ,任何 低 于 一 1 的 出 价 也 不 是 占 优 的 。 不 妨 设 出 价 加 三 vi 一 2。 如 果 没 有 中 
标 ,得 益 自然 是 0。 如 果 中 标 , 得 益 为 4 一 bl 。 此 时 须 为 乐观 估价 ,应 有 4 二 v1 一 6。 注 意 到 
6 二 2, 因 此 最 后 得 益 为 v1 一 2 一 b1 ,仍然 是 0。 可 见 ,出 价 一 1 是 弱 占 优 的 。 

最 后 ,证 明 占 优 策略 负 二 vi 一 1 却 是 不 能 获 利 的 。 注 意 到 vi 二 20 ,依照 策略 红 城 应 出 
价 二 19。 

如 果 红 城 的 估价 偏 高 , 即 vi = 二 4 十 6, 易 知 4 二 18。 此 时 蓝海 的 估价 较 低 , 则 vz 二 4 一 
6 二 16。 所 以 蓝海 的 出 价 为 bz 二 15。 那 么 , 红 城 将 会 得 到 标的 。 但 是 中 标 之 后 他 将 发 现 
物品 价值 为 + 二 18。 实 则 亏损 1 元 ! 

如 果 红 城 的 估价 偏 低 , 即 vi 二 4 一 6, 依 策略 出 价 仍 是 19。 显 然 ,蓝海 的 估价 较 高 ,有 
v2 二 A 十 6 二 wi 十 26 二 24。 所 以 ,蓝海 应 出 价 23。 红 城 由 于 出 价 较 低 未 能 中 标 , 得 益 为 0。 

综 上 可 知 , 红 城 的 期 望 得 益 为 

0.5X(—1)+0.5X0=—0.5 

显然 , 红 城 不 仅 中 标 时 的 得 益 为 负 , 而 且 期 望 所 得 也 是 负 的 。 利 用 这 样 一 个 占 优 策 
略 , 最 后 结果 却 不 能 获 利 。 这 便 是 “ 赢 者 的 诅咒 ”。 

“ 赢 者 的 诅咒 ?是 竞争 环境 中 多 方 博弈 的 结果 ,在 现实 中 屡见不鲜 。 例 如 ,1996 年 5 
月 ,美国 联邦 通信 委员 会 决定 拍卖 一 部 分 无 线 频谱 。 显 然 ,这 些 频 谱 的 未 来 市 场 价值 在 拍 
卖 前 是 不 能 确 知 的 ,各 竞拍 者 只 能 依赖 自己 所 掌握 的 信息 进行 评估 。 但 是 它 的 真实 价值 
确实 存在 ,属于 共同 价值 拍卖 。 最 大 投标 人 NextWave 个 人 通信 公司 最 终 胜出 ,以 47 亿 
美元 获得 63 个 经 营 许可 证 。 但 是 两 年 后 ,该 公司 经 营 困难 ,申请 破产 。NextWave 公司 
赢得 了 拍卖 , 却 输 掉 了 市 场 。 另 外 ,经 济 学 家 们 曾 收集 了 大 量 真实 的 数据 ,验证 了 * 赢 者 的 
诅咒 "这 一 现象 的 广泛 存在 性 。 而 且 竞价 者 越 多 ,竞争 越 激 烈 , 其 发 生 的 机 会 也 越 大 。“ 赢 
者 的 诅咒 ?不 仅 伤害 买方 ,对 卖方 也 会 导致 不 利 的 影响 。 当 买方 无 法 确认 物品 的 价值 时 ， 
他 们 会 担心 付出 太 多 ,“ 赢 者 的 诅咒 ?会 使 得 所 有 的 竞买 者 都 压低 出 价 , 从 而 减少 卖方 的 收 
入 。 要 破除 * 赢 者 的 诅咒 ” ,卖方 必须 提供 物品 的 相关 信息 ,使 买方 了 解 物品 的 价值 。 这 就 
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降低 了 “ 赢 者 的 诅咒 ?对 拍卖 收入 的 负面 影响 ,从 而 提高 了 竞买 者 的 出 价 。 

但 是 也 提请 读者 注意 ，“ 赢 者 的 诅咒 ?可 能 只 是 多 重 均衡 中 的 某 一 个 所 导致 的 结果 , 因 
此 并 非 不 能 消除 。 实 践 发 现 ,通过 建立 适当 的 拍卖 机 制 ,可 以 避免 “ 赢 者 的 诅咒 ”。 仍 举 无 
线 频谱 拍卖 的 例子 。 经 过 20 年 的 拍卖 实践 ,今天 的 频谱 拍卖 在 规则 设计 中 出 现 重大 问题 
的 概率 已 经 很 小 。 例 如 ,在 2012 年 11 月 12 日 英国 无 线 电 通信 办 公 室 公布 了 4G 频谱 拍 
卖 的 规则 ,包括 具体 的 拍卖 日 程 安排 .参与 拍卖 的 资格 、 拍 卖 保 留 价 格 及 拍卖 模式 等 。 关 
于 4G 频谱 拍卖 的 拍卖 模式 ,英国 无 线 电 通信 办 公 室 选择 了 "组 合 时 钟 ? 拍 卖 ,该 模式 共 包 
括 6 个 阶段 : 组 合 块 ,选择 加 入 阶段 ,时 钟 阶段 ,补充 拍卖 ,第 二 价格 规则 ,分 配 阶段 。 每 
个 阶段 都 有 具体 的 规则 ,总 体 类 似 于 常见 拍卖 的 组 合 。 据 英国 政府 公布 ,拍卖 4G 频谱 的 
收入 仅 为 23.4 亿 英 镑 , 较 此 前 预期 的 35 亿 英 镑 低 了 1/3。 尽 管 对 此 收入 争论 不 断 , 但 有 
一 点 非常 明确 : 此 次 拍卖 没有 带 来 传说 中 的 “ 赢 者 的 诅咒 ”。 
WW 进 阶 阅读 

假设 有 两 个 竞价 者 ,分 别 记 为 1.2。 竞价 者 i 对 商品 的 估价 为 vi 如 果 投 标 人 i 以 
竞拍 价格 0 得 到 商品 , 则 i 的 得 益 为 vi 一 b。 两 个 竞价 者 的 估价 相互 独立 ,并 服从 [0,1] 区 
间 上 的 均匀 分 布 。 双 方 同时 给 出 自己 的 出 价 ,不 能 为 负 。 出 价 较 高 的 一 方 得 到 商品 ,并 支 
付 他 所 报 的 价格 ; 另 一 方 则 得 益 为 0。 竞价 者 是 风险 中 性 的 , 且 上 述 内 容 都 是 共同 知识 。 

为 把 这 一 问题 转化 为 静态 贝 叶 斯 博弈 ,必须 先 确定 行动 、 类 型 及 得 益 函 数 。 竞 价 者 i 
的 行动 是 他 的 非 负 出 价 bi, 其 类 型 是 他 的 估价 vi。 由 于 估价 是 相互 独立 的 ,竞价 者 i 推断 
vj 服从 [0,1] 区 间 上 的 均匀 分 布 一 一 独立 于 vi 的 取 值 ,j 关 i。 最 后 ,竞价 者 i 的 得 益 通 
数 为 


vi— bi, 当 bi;> bj 
ui(bi,b2; visv2) = 4(v0i—b0i)/2, bi = bj 
0， bi=ob; 


为 推导 贝 叶 斯 纳什 均衡 ,首先 建立 参与 者 的 策略 集合 。 回 忆 第 5.2 节 的 内 容 , 在 静态 
贝 叶 斯 博弈 中 策略 是 一 个 由 类 型 到 行动 的 函数 。 竞 价 者 i 的 一 个 策略 为 函数 bi(vi), 据 
此 可 以 决定 i 在 任 一 给 定 类 型 v; 下 所 选择 的 出 价 b;。 若 策略 组 合 {D1(v1),bz(v2)} 是 一 
个 贝 叶 斯 纳什 均衡 ,那么 对 于 任 给 类 型 vi E50,1],0bi(vi) 应 满足 : 
max[(w 一 如 PC > 与 ) 十 于 (Ci 6D Pb: =6)], i= 1,2 


上 式 中 P(。) 表 示 所 求 事 件 的 概率 。 简 单 起 见 , 仍 考虑 一 组 线性 策略 组 合 , 即 假设 
DCul) 和 02(u2) 都 是 线性 函数 中 。 设 
bol) 一 aa 十 clu， bo(v) = a cv 


现 求 解 该 均衡 , 亦 即 上 述 函数 的 参数 。 


@ 值得 注意 的 是 ,此 处 不 是 限制 了 参与 者 的 策略 空间 以 使 之 仅 包 含 线性 策略 ,而 是 允许 参与 者 任意 地 选择 但 是 
仅 关注 是 否 存在 线性 均衡 解 。 
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对 于 竞价 者 i(i 一 1,2), 给 定 对 手 所 采取 的 策略 妨 (vj) 王 aj 十 cjvi 以 及 自己 的 估价 
vi, 他 的 最 优 反 应 实 为 下 式 的 解 : 


max[ (vw — bi)P(bi > ai + civi) 十 到 (mw 三 而 )P( 天 三 太 启 


因为 v 服从 均匀 分 布 ,所 以 bj(vj) 二 qj 十 cj (vj) 服 从 均匀 分 布 ,进而 P{bi 二 bj}) 二 0。 
因此 , 实 为 求解 
max{ (vi —bi)PLv; < (bi — a;)/c;]} 

由 于 估价 viE[0,1], 因 此 出 价 b; 应 满足 ai; 三 bi 三 ai 十 ci;。 考 虑 到 策略 的 对 称 性 , 因 
此 出 价 bi 也 应 介 于 对 手 的 上 下 限 内 , 即 aj 二 bi 人 qj 十 cj。 否 则 ,如 果 出 价 bi 超越 了 对 手 
的 上 下 界限 ,竞价 者 了 也 会 调整 自身 的 上 下 限 以 利于 自己 。 如 此 反复 ,二 者 的 上 下 界 仍 会 
趋 于 相等 。 

在 上 述 条 件 下 ,如 何 出 价 问题 转换 为 求解 下 式 : 

max{ (vi — b:) PLv; < (bi — aj;)/c;j} max(v bi) (bi CO—ai) /ci 


不 难 计算 ,最 优 解 为 bi; 二 (vi 十 aj)/2。 注 意 , 在 vi 二 a; 时 bi 


(vita) 
区 


二 aj, 此 时 不 


可 能 中 标 ,因此 令 出 价 所 二 a;。 综 上 ,参与 者 i 的 占 优 策 略为 


(Wa)/2。 六 沁 鲁 
bi(vi) = 
laj, vi aj 


(1) 如 果 0 过 aj 二 1, 则 一 定 存在 某 些 vi 使 得 vi 二 a;。 此 时 与 bi(vi) 的 线性 假设 矛盾 ， 
排除 。 

(2) 如 果 aj 宇 1, 则 不 可 能 发 生 。 然 而 出 价 bi 二 aj; 又 使 其 得 益 为 负 。 因 此 ,排除 该 
情形 。 

(3) 如 果 aj 志 0, 则 bi(vi) 二 (vi 十 aj)/2 二 ai 十 civi。 于 是 可 得 ai 二 aj/2 及 ci 一 1/2。 
同样 对 竞价 者 j 重复 上 面 的 分 析 , 得 到 类 似 的 结果 aj 二 ai/2 及 ci 二 1/2。 联 立 求解 可 得 
ai 二 Qj 二 0 及 ci 二 1/2。 

因此 线性 的 出 价 策略 均衡 为 bi(vi) 二 vi/2。 


5.3.2 二 价 密封 拍卖 


上 引 语 故事 : 1990 年 新 西 兰 无 线 频谱 拍卖 


1990 年 ,新 西 兰 举办 了 第 一 场 使 用 频谱 权利 的 拍卖 。 根 据 咨 询 公 司 NERA 的 建议 ， 
新 西 兰 政府 决定 最 初 的 4 场 拍卖 均 采 用 二 价 密封 拍卖 ,其 规则 与 维 克 瑞 最 早 所 描述 的 一 
样 。 与 首 价 密封 拍卖 相 比 ,虽然 同 是 报价 最 高 者 得 到 标的 ,但 是 成 交 价格 却 为 次 高 报价 。 
表 5-6 列 出 了 新 西 兰 第 一 场 拍卖 的 实际 结果 。 竞 价 者 Sky Network TV 的 报价 都 很 高 ， 
为 获得 许可 证 所 支付 的 价格 比 其 他 竞价 人 要 高 出 很 多 。 竞 价 者 Totalisator Agency 
Board 向 6 份 许可 证 投标 ,每 份 许可 证 的 报价 都 是 40.1 万 新 西 兰 元 ,但 他 最 终 只 得 到 了 
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一 份 许可 证 ,成 交 价 格 为 10 万 新 西 兰 元 。 竞 价 者 BCL 只 给 一 份 许可 证 投标 ,报价 为 25.5 
万 新 西 兰 元 , 它 最 终 以 20 万 新 西 兰 元 获得 了 该 份 许可 证 。 由 于 不 知道 不 同 数量 的 许可 证 
对 于 竞价 者 的 价值 ,也 不 可 能 确定 许可 证 的 最 终 分 配 是 否 有 效 。 但 是 ,结果 确实 证 明了 竞 
价 者 无 法 推测 其 他 竞价 者 的 投标 行为 。 如 果 你 再 看 一 遍 表 5-6, 也 许 能 够 理解 Sky 
Network TV ,BCL 或 者 United Christian Broadcast 在 报价 公布 后 的 心情 …… 

一 一 摘编 自 米 格 罗 姆 著 , 杜 黎 、 胡 奇 英 等 译 ( 拍 卖 理论 与 实务 》 


表 5-6 超 高 频频 谱 (8 兆赫 ) 拍 卖 的 最 高 价 和 次 高 价 


编号 赢 者 最 高 报价 /新 西 兰 元 次 高 报价 /新 西 兰 元 

1 Sky Network TV 237. 主 万 40. 1 万 
2 Sky Network TV 227.3 万 40. 1 万 
3 Sky Network TV 227. 3 万 40. 1 万 
4 BCL 25.5 万 20 万 

5 Sky Network TV 112.1 万 40.1 万 
6 Totalisator Agency Board 40.1 万 10 万 

United Christian Broadcast 68.5 万 40.1 万 


二 价 密封 拍卖 ,又 称 维 克 瑞 拍卖 ,是 诺 贝尔 经 济 学 奖 获得 者 维 克 瑞 所 提出 的 。 在 二 价 
密封 拍卖 中 ,出价 最 高 者 赢得 拍卖 品 ,但 是 只 需 支付 所 有 出 价 中 的 第 二 高 价格 ,其 他 部 分 
则 与 首 价 密封 拍卖 相同 。 由 于 在 二 价 密封 拍卖 中 胜出 者 的 出 价 独立 于 最 后 成 交 价 , 因 此 
二 价 密封 拍卖 被 认为 是 鼓励 竞价 者 依照 估价 而 真实 出 价 的 拍卖 机 制 , 从 而 避免 了 “ 赢 者 的 
诅咒 ”。 换 言 之 ,在 没有 串通 的 情况 下 ,每 个 投标 者 的 最 优 策略 就 是 依照 自己 对 拍卖 品 的 
估价 而 据 实 出 价 。 这 种 看 似 奇 怪 的 拍卖 机 制 是 如 何 引导 竞价 者 出 价 的 ? 

先 让 我 们 看 一 个 相对 直观 的 解释 。 如 引 例 所 示 , 由 于 交易 价格 独立 于 竞价 者 的 出 价 ， 
因此 当 竞 价 者 压低 出 价 使 之 低 于 自己 的 估价 时 ,并 不 能 增加 自身 的 得 益 , 反 而 会 降低 赢 取 
标的 的 概率 。 反 之 ,竞价 者 抬 高 出 价 至 大 于 自己 估价 时 ,尽管 提高 了 胜出 概率 ,但 是 得 益 
为 负 。 因 此 ,无 论 低 报 还 是 高 报 ,都 不 如 按照 自己 的 估价 进行 真实 出 价 好 。 这 样 ,在 二 价 
密封 拍卖 中 ,每 个 人 都 会 说 真 话 , 可 以 有 效 地 解决 “ 赢 者 的 诅 咯 ”问题 。 但 是 , 深 至 具体 决 
策 ,果真 如 此 吗 ? 

为 方便 讨论 , 仍 沿用 上 节 房 地 产 开发 的 例子 ,并 将 出 价 离散 化 。 设 定 出 价 递增 幅度 为 
10 , 意 即 每 个 参与 者 的 策略 是 离散 的 ,分 别 为 10.20.30,…。 因 此 ,可 将 博弈 模型 明确 
如 下 。 

博弈 参与 者 : 红 城 ,蓝海 。 

自然 赋予 的 类 型 : (a,b) ,其 中 

a: 估价 50, 概 率 为 0.6。 

b: 估价 100, 概 率 为 0. 4。 
行动 : 报价 (10,20,30,…), 递 增幅 度 为 10。 
得 益 : 得 益 一 估价 一 出 价 。 
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附加 判定 : 车 出 价 相 同 , 则 抛 硬币 决定 谁 来 购买 (50% 概 率 可 以 得 到 )。 

在 首 价 密 封 拍卖 中 ,双方 都 采取 “如 果 估 价 50 就 出 价 40; 如 果 估 价 100 就 出 价 60” 
是 一 个 贝 叶 斯 纳什 均衡 。 现 讨论 该 均衡 在 二 价 密封 拍卖 中 是 否 仍然 成 立 。 鉴 于 对 称 性 ， 
不 妨 从 红 城 着 手 分 析 。 

首先 ,如 果 红 城 的 估价 是 50 ,考虑 到 蓝海 的 出 价 有 60% 的 可 能 性 是 40, 男 有 40% 的 
可 能 性 为 60, 则 在 出 价 40 时 红 城 的 期 望 得 益 为 0.6X0.5X(50 一 40) 十 0. 4X0=3。 

上 式 中 的 0.5 因子 仍 代表 猜 硬币 获胜 的 概率 。 类 似 地 ,依照 二 价 密 封 拍卖 规则 ,可 计 
算 其 他 出 价 所 对 应 的 期 望 得 益 如 表 5-7 所 示 。 显 然 出 价 40 不 是 在 估价 50 时 的 占 优 策 
略 , 此 时 的 占 优 策略 是 50( 按 照 自己 的 真实 估价 报价 ) 。 


表 5-7 红 城 估价 50 时 的 报价 与 得 益 


报价 10 20 30 40 50 60 70 80 


得 益 0 0 0 3 6 4 2 2 


其 次 ,如 果 红 城 的 估价 为 100, 在 出 价 60 时 他 的 期 望 得 益 为 0. 6X(100 一 40) 十 0. 4X 
0.5X(100—60)=44。 
同 理 , 其 他 出 价 方式 所 对 应 的 期 望 得 益 如 表 5-8 所 示 。 可 见 , 出 价 60 不 是 占 优 策略 ， 
而 出 价 100( 按 照 自己 真实 估价 报价 ) 是 一 个 弱 占 优 策略 。 
表 5-8” 红 城 估价 100 时 的 报价 与 得 益 


报价 i 30 40 50 60 70 80 90 100 


得 益 oa 0 18 36 44 52 52 52 52 


现 考虑 新 的 策略 组 合 :( 红 城 真 实 出 价 ,蓝海 仍 采取 原 策略 ) 。 显 然 , 此 时 仍 不 是 贝 叶 
斯 纳什 均衡 。 

继续 考虑 另 一 新 策略 组 合 : 两 公司 均 采取 “如 果 估 价 50 就 出 价 50 ,估价 100 就 出 价 
100”。 再 次 从 红 城 人 手 分 析 。 

首先 ,如 果 红 城 估 价 50, 在 出 价 50 时 的 期 望 得 益 为 0.6X0.5X(50 一 50 十 0. 4X0)= 
0, 同 理 可 得 ,其 他 出 价 所 对 应 的 期 望 得 益 如 表 5-9 所 示 。 


表 5-9 出 价 为 估价 的 情况 


出 价 10 20 30 40 50 60 70 80 


其 次 ,如 果 红 城 估价 100 ,在 出 价 100 时 的 期 望 得 益 为 0. 6X(100 一 50) 十 0. 4X0.5X 
(100 一 100) 一 30。 

同 理 可 得 在 其 他 出 价 下 所 对 应 的 期 望 得 益 , 如 表 5-10 所 示 。 可 见 按照 自己 的 真实 估 
价 进行 出 价 是 一 个 弱 占 优 策略 。 
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表 5-10 估价 100 且 真 实 出 价 时 的 出 价 和 得 益 


出 价 We 30 40 50 60 70 80 90 100 


得 益 和 0 0 15 30 30 30 30 30 


可 见 ,在 二 价 密封 拍卖 中 ,每 个 人 都 会 说 真 话 。 而 且 , 上 述 讨 论 中 并 没有 假定 每 个 人 
都 是 说 真 话 的 。 这 也 就 意味 着 ,无 论 别 人 是 否 真实 出 价 , 对 每 个 竞价 者 而 言 依 照 自己 估价 
而 真实 出 价 是 最 好 的 选择 。 这 就 是 二 价 密封 拍卖 机 制 的 一 个 基本 特点 。 同 时 , 它 也 揭示 
了 一 个 道理 : 要 让 拥有 私有 信息 的 人 真实 地 披露 自己 的 信息 ,就 应 该 给 他 足够 的 激励 ,而 
赢得 拍卖 时 的 净 得 益 ( 真 实 价值 减 去 出 价 ) 就 是 诱 使 他 说 真 话 的 "信息 租金 "。 显 然 , 依 照 
次 高 价格 支付 减少 了 卖方 的 收入 ,这 是 他 对 “信息 租金 "的 支付 。 


2 扩展 阅读 : 拍卖 网 站 的 交易 规则 


维 克 瑞 是 最 先 引入 二 价 拍卖 的 学 者 ,并 将 它 作为 增 价 拍卖 ( 英 式 拍卖 ) 的 一 个 模型 , 现 
在 拍卖 网 站 上 普遍 使 用 的 也 是 这 一 模型 。 图 5-8 和 图 5-9 所 示 为 淘宝 网 站 拍卖 示意 图 。 


0 号 车 位 使 用 权 疹 竞 买 帮助 
1,190,000 : [ol 
00=<01,26,58.4: I 
EE 
mr 
出 价 1,195,000 PE 
提 盘 : 先 交 保证 金 再 出 价 ， 至 少 两 人 报名 且 出 价 达 保留 价 方 可 成 交 
起 拍 价 : #l100,000 加 价 畅 度 : ¥5,000 EE 型 : 拍卖 司 
评 估 价 : 2,127,400 价 半期 : :天 园 优 先 购买 权 人 
保 证 金 :00,000 适时 半期 : 5 分 钟 /次 保留 信 
12 64 4044 


图 5-8 淘宝 网 站 某 车 位 使 用 权 的 拍卖 


为 了 说 明 这 一 点 ,请 读者 参阅 图 5-8 和 图 5-9 所 示 的 网 站 拍卖 界面 与 竞价 记录 。 图 
中 的 交易 价格 是 第 一 价格 还 是 第 二 价格 ? 答案 是 第 一 价格 ! 那么 , 它 又 为 何 被 称 为 二 价 
拍卖 ? 提请 读者 注意 ,诸如 易趣 (eBay) 和 亚马逊 (Amazon) 等 许多 网 站 都 鼓励 竞价 人 使 用 
投标 代理 (proxy bidding)。 竞 价 人 告诉 他 的 代理 所 愿意 支付 的 最 高 价 , 即 他 的 最 高 出 价 。 
投标 代理 替 他 保守 这 个 秘密 ,并 代替 他 在 增 价 拍卖 中 出 价 。 倘 车 这 一 出 价 没 有 超过 别人 
的 出 价 而 成 为 最 高 竞价 (网 站 上 的 当前 价 ), 则 只 要 不 超过 竞价 人 的 最 高 价 ,投标 代理 就 将 
报价 提高 一 个 增 量 ( 网 站 上 的 加 价 幅度 )。 如 果 每 个 竞价 人 都 使 用 投标 代理 ,那么 结果 就 
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状 而 况 买 号 仿 格 时 间 

EE3 K1285 1,210,000 2016 午 04 用 301] 08:35:09 
EI F2046 1,200,000 2016 和 04 用 30 日 08:33:13 
出 恒 Re285 1,190,000 2016T041309 07.49:40 
出 同 L8770 1,185,000 2016%04 叶 30F 06:47:15 
EL) U6599 1,180,000 2016104 月 29 日 21:12:54 
出 司 U6599 1,140,000 2016%04/1298 21:12:16 


图 5-9 车 位 拍卖 的 部 分 竞价 记录 


是 : 最 高 价 最 大 的 那 位 竞价 人 也 将 出 价 最 高 ,获得 拍卖 品 。 胜 出 者 所 支付 的 价格 等 于 所 
有 最 高 价 中 的 次 高 价 。 如 果 用 "出 价 ” 代 替 "最 高 价 " 这 一 术语 , 则 上 述 规则 正好 与 二 价 密 
封 拍卖 的 规则 相同 。 用 博弈 论 的 术语 来 说 就 是 , 含 投标 代理 的 英 式 拍卖 (公开 增 价 拍卖 ) 
和 密封 二 价 拍卖 是 策略 等 价 的 。 两 者 的 策略 集合 之 间 存 在 着 一 一 对 应 的 关系 ,使 得 相对 
应 的 策略 组 合 产生 同一 结果 。 实 际 上 ,每 个 网 站 的 向 上 叫价 拍卖 规则 可 能 会 稍 有 不 同 ,而 
且 会 随 着 时 间 逐 步 修 改 ,趋向 完善 。 上 述 内 容 只 是 简 述 了 拍卖 机 制 的 要 点 。 


那么 ,二 价 密封 拍卖 就 是 完美 的 吗 ? 回答 当然 是 否定 的 。 世 界 上 本 就 没有 十 全 十 美 
的 事物 ,真实 报价 问题 只 是 在 一 定 条 件 下 成 立 , 同 时 二 价 密封 拍卖 也 会 遇 到 其 他 问题 。 在 
新 西 兰 政府 1990 年 所 举行 的 4 场 拍卖 中 ,政府 虽然 避免 了 “ 赢 者 的 诅咒 ,但 也 出 现 了 对 
拍卖 方 不 利 的 情况 。 例 如 ,麦克 。 米 兰 (Mc Millan,1994) 曾 这 样 描述 :“ 一 种 极端 的 情 
况 ,公司 报价 为 10 万 新 西 兰 元 ,但 最 终 以 次 高 报价 6 万 新 西 兰 元 成 交 。 另 一 种 极端 的 情 
况 , 最 高 报价 是 700 万 新 西 兰 元 ,次 高 报价 是 0. 5 万 新 西 兰 元 。 "政府 的 咨询 顾问 预计 通过 
拍卖 获得 的 总 收入 会 达到 2. 5 亿 新 西 兰 元 ,但 事实 上 仅 获得 3 600 万 新 西 兰 元 。 在 开展 
频谱 拍卖 两 年 后 ,新 西 兰 政府 认为 二 价 密封 拍卖 未 能 体现 频谱 的 真实 价值 , 故 在 1991 年 
至 1994 年 ,将 拍卖 方式 改 为 首 价 密封 拍卖 。 从 1995 年 起 ,新 西 兰 政府 决定 采用 与 美国 相 
同 的 同步 增 价 拍卖 模式 。 而 2012 年 英国 政府 的 4G 频谱 拍卖 则 采用 时 钟 拍卖 和 二 价 密 
封 拍卖 相 结合 的 组 合 规则 一 一 前 文 已 经 提 及 。 除 上 述 情 况 外 ,由 于 卖家 是 清楚 物品 真实 
价格 的 ,所 以 可 能 委托 他 人 混入 竞拍 者 中 以 提高 交易 价格 。 这 样 做 会 使 交易 价格 接近 物 
品 的 真实 价格 ,以 获得 更 高 的 利益 。 这 就 是 卖方 的 “ 托 价 ? 行 为 。 

从 理论 上 讲 , 一 个 收入 最 大 化 的 拍卖 机 制 应 当 把 标的 物 卖 给 具有 最 高 边际 收入 而 不 
是 最 高 价值 (最 高 估价 者 ) 的 买方 。 换 言 之 ,为 了 追求 收入 最 大 化 ,拍卖 方 通常 会 区 别 对 待 
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不 同 的 竞价 者 ,特别 是 偏向 于 来 自 * 弱 ”分 布 2 的 竞价 者 一 方 。 在 首 价 密封 拍卖 中 ,弱势 的 
(来 自 弱 分 布 ) 的 竞价 者 受到 强势 竞价 者 的 竞争 压迫 ,通常 会 比 强 势 竞价 者 出 价 更 凶猛 , 即 
出 价 更 接近 真实 值 。 因 此 , 首 价 密封 拍卖 是 有 利于 弱势 竞价 者 的 。 相 比 之 下 ,在 二 价 密封 
拍卖 中 ,标的 物 在 满足 私有 价值 条 件 下 总 是 卖 给 估价 最 高 的 竞价 者 。 因 此 ,从 期 望 收入 角 
度 看 首 价 密封 拍卖 一 般 会 比 二 价 密封 拍卖 要 好 ,但 是 它 的 资源 配置 效率 却 相 对 要 差 。 
W 进 阶 阅读 

设 有 n 个 竞价 人 竞拍 一 个 物品 。 竞 价 者 i(i 二 1,2,…,n) 对 拍卖 品 的 真实 估价 为 vi， 
独立 于 其 他 竞价 者 的 估价 vj,j 隆 i。 不妨 将 竞价 者 的 估价 进行 排序 , 即 四 二 u 二 … 二 
-1 二 ww 二 0。 竞 拍 规则 为 上 述 二 价 密封 拍卖 的 规则 。 若 竞价 者 i 赢得 标的 , 则 其 得 益 为 

i 二 Vi 一 Dj， 其 中 b; 为 次 高 出 价 ; 否则 为 0。 

另外 ,如 有 两 个 以 上 的 竞价 人 出 价 相 同 , 则 按 竟 价 人 的 序号 决定 胜 者 。 例 如 ,车 
01(v1) 二 bz (vz), 则 判定 竞价 人 1 胜出 。 但 由 于 “次 高 价 ” 与 最 高 价 相同 ,所 以 交易 价格 仍 
等 于 自身 出 价 (v1)。 于 是 其 得 益 为 v1 一 b1(v1)。 

这 个 博弈 存在 多 个 均衡 ,但 此 处 只 介绍 其 中 3 个 : 四 真实 出 价 策略 组 合 , 意 即 每 个 竞 
价 人 都 按照 自己 的 估价 进行 出 价 , 没 有 低 报 或 高 报 ; 四 垄断 出 价 策略 组 合 , 指 竞价 人 在 胜 
算 不 大 时 采取 防守 策略 ,出 价 为 0 一 一 只 有 估价 最 高 .胜算 最 大 的 竞价 人 1 诚实 出 价 ; 
回 交互 垄断 策略 组 合 , 即 在 胜算 较 高 的 两 人 中 间 相 互 以 对 方 的 估价 作为 出 价 , 而 其 他 人 仍 
然 采 取 防 守 策略 。 

(1) 真实 出 价 策略 组 合 。 此 时 (Bi1,b2,… bn) 二 (v1,v2，…… ,vn), 即 每 个 竞价 人 i 都 按 
自己 的 估价 vi 而 真实 出 价 。 竞 价 的 结果 当然 是 竞价 人 1 胜出 ,因为 Wi 二 uv 二 … 之 wm 一 1 之 
vn。 他 的 得 益 为 ul 记 1 一 bz，, 而 其 他 竞价 人 得 益 为 0。 

下 面 证 明 真实 出 价 策略 组 合 是 一 个 贝 叶 斯 纳什 均衡 。 

第 一 ,竞价 人 1 对 于 真实 出 价 是 不 会 产生 背离 动机 的 。 当 中 二 v1 时 ,ul 二 v1 一 bz 二 
ul 一 2 二 0。 和 否则 , 若 出 价 往 二 ml 固然 能 赢得 标的 ,但 不 会 改变 得 益 水 平王 v1 一 b2。 因 
此 , 庶 高 报价 并 不 能 给 他 带 来 更 多 收益 。 若 出 价 和 二 ul, 则 可 能 会 发 生 和 一 02< 一 ul 的 不 
幸 事件 。 竞 价 人 输 掉 标的 ,得 益 为 0! 因此 ,压低 出 价 将 会 带 来 低 于 真实 出 价 时 的 得 益 。 
所 以 ,真实 出 价 是 一 个 弱 占 优 策略 。 

第 二 , 别 的 竞价 人 j(j 二 2,3,…,n) 也 不 会 有 改变 自己 真实 出 价 的 动机 。 当 bj 二 wv 
时 ,由 于 不 能 中 标 ,得 益 为 0。 如 果 bj 关 vj ,一 种 可 能 是 bj 三 四 二 v1, 则 竞价 人 j 仍然 不 能 
中 标 ,得 益 仍 是 0; 另 一 种 可 能 是 bj 记 bD1 一 v1。 这 时 j 会 赢得 标的 ,但 得 益 却 为 负 , 即 wj 二 
Vj 一 1 二 vj 一 V1 过 0。 显然 , 劣 于 真实 出 价 。 WE 也 无 动机 偏离 。 

(2) 礁 断 出 价 策略 组 合 , 即 (1,52，,… ,ba) 二 (v1,0,…,0)。 此 时 除 竞 价 人 1 以 外 的 所 
有 其 他 竞价 人 都 报价 为 0, 从 而 塌 二 v1 一 0 二 V1。 为 什么 这 也 是 一 个 贝 叶 斯 纳什 均衡 ? 

首先 ,竞价 人 1 没有 背离 动机 。 不 妨 假设 耻 关 1。 鉴于 如 宇 0, 因 此 即使 他 出 价 b1 二 


@ 所 谓 分 布 的 强 和 弱 , 粗 略 地 讲 意 指 前 者 的 分 布 一 阶 随 机 优 于 后 者 。 
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0 也 会 赢 一 一 所 有 出 价 相 同时 依照 身份 序号 选 胜 。 此 时 得 益 为 1 一 v1 一 0 二 v1。 所 以 , 真 
实 出 价 是 一 个 弱 占 优 策略 。 

其 次 , 别 的 竞价 人 j 也 没有 动机 改变 自己 的 0 出 价 策略 。 假 设 廊 盖 0, 只 要 擅 去 各 二 
vl, 那么 竞价 人 j 仍 输 , 得 益 同样 为 0; 当 bj; 记 bl 二 vi ,尽管 竞价 人 j 会 赢得 标的 ,但 wj 一 
Vi 一 V1 三 0, 反倒 不 如 uj 二 0。 

(3) 交互 垄断 策略 组 合 , 可 表示 为 (0 ,bp .… bn) 二 (v2,v1,0,…,0)。 此 时 估价 最 高 
的 两 位 竞价 人 互相 揣测 对 方 ,以 对 方 的 估价 作为 出 价 ,而 其 他 竞价 人 则 出 价 为 0。 换 言 
之 ,竞价 人 1 出价 聘 二 v2 ,而 竞价 人 2 出 价 bz 二 vi ,使 得 bz 二 bl1。 显 然 ,ul 一 0, 但 uz 也 等 
于 零 , 因 为 uz 二 v2 一 站 二 v2 一 bz 二 0。 

这 也 是 一 个 纳什 均衡 吗 ? 回答 是 肯定 的 。 

首先 ,竞价 人 1 没有 动机 背离 h 二 vz。 否则 ,假如 册 宇 1, 则 竞价 人 1 胜出 (因为 bz 二 
v1)。 但 此 时 二 1 一 bz 二 v1 一 v1 二 0, 并 不 比 出 价 轴 二 vs 时 有 任何 改善 。 如 果 bl 二 v1， 
则 竞价 人 1 仍 输 掉 拍卖 品 , 仍 得 益 为 0。 因此 ,当前 策略 是 一 个 弱 占 优 策略 。 

其 次 ,竞价 人 2 也 没有 动机 背离 bz 二 vi。 否则 ,假设 加 二 uv , 则 竞价 人 2 仍然 胜 
出 一 一 因为 四 二 vz。 此 时 仍 有 uz 二 ve 一 D1 二 0, 并 无 增益 。 假 设 bz 二 v2, 则 竞价 人 2 给 掉 
拍卖 ,使 uz 二 0。 因 此 ,当前 策略 也 是 一 个 弱 占 优 策略 。 

最 后 ,其 他 任何 竞价 人 j( 二 3,4,…,n) 的 策略 bj 二 0 也 是 弱 占 优 策略 。 请 读者 自行 
定之。 

在 上 述 3 个 均衡 中 ,前 两 个 均衡 是 竞价 人 1 获胜 ,而 第 三 个 均衡 则 是 竞价 人 2 获 
胜 。 同 样 地 ,读者 可 以 依次 举 出 让 竞价 人 3,4,…,n 获胜 的 策略 组 合 , 并 且 证 明 它 们 是 
均衡 。 

由 (3) 可 见 出 价 (1 二 ve ,bz 二 v1i) 也 可 以 成 为 纳什 均衡 ,似乎 与 二 价 拍卖 引导 真实 出 
价 的 说 法 相 冲 突 。 但 实际 上 这 两 处 并 不 矛盾 。 从 前面 的 学 习 中 我 们 知道 , 当 存 在 多 个 纳 
什 均 衡 时 , 某 些 均 衡 经 过 精炼 是 可 以 被 排除 的 。 这 里 ,我 们 只 要 运用 “ 别 除 弱 劣 策略 ”这 一 
准则 ,就 可 以 排除 第 三 个 例子 中 那个 纳什 均衡 。 接 下 来 将 证 明 每 个 人 诚实 出 价 即 (b1， 
b2 sbn) 二 (v1 v2,"… ,vn) 是 一 个 弱 占 优 策略 。 

如 果 bi 了 vi(i 二 1,2,…,n), 则 有 下 述 两 种 情形 。 

(1) 出 价 6 过 vi, 又 分 三 种 可 能 。 

首先 , 若 bj 二 bi 二 vi, 竞 价 人 i 仍 会 赢得 拍卖 ,得 益 为 wiv maxt{b;}, 显然 ,此 时 并 
不 比 出 价 bi 二 vi 时 更 好 。 

其 次 , 若 b; 一 vi 一 bj ,竞价 人 i 输 掉 拍卖 ,得 益 ui 二 0。 不 难 推 知 ,即使 0i 王 vi, 竞价 人 i 
仍 会 输 , 因 此 得 益 ui 一 0。 从 而 出 价 bi 二 vi 不 差 于 bi 二 vi。 

最 后 , 若 bi<maxtbj)<vis, 则 竞价 人 i 输 掉 拍卖 ,其 得 益 ui 二 0; 而 如 果 出 价 bi 二 vi， 
竞价 人 i 的 得 益 为 0 所 以 出 价 bi 二 vi 优 于 出 价 b; 二 vi。 

(2) 出 价 5 二 vi, 同 样 可 分 为 下 列 三 种 可 能 。 

首先 , 若 Wmax{b)<bi, 竞 价 人 i 胜出 ,但 得 益 为 负 : 入 二 全 加 地 下 <05 因此 ， 
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不 如 诚实 出 价 (bi 二 vwi)。 

其 次 ,车 max{ 刀 )<vi<bi ,出 Ww max) 这 也 不 比 出 价 bi 二 vi 更 好 。 

最 后 ,如 果 max{ 刀 bi 这 vi， 则 Ui 二 0, 仍 然 没有 优 于 出 价 bi 二 vi。 

由 此 可 见 , 无 论 对 手 j( 隆 让 如 何 出 价 ,bi 二 vi 至 少 与 bi 了 vi 一 样 好 。 因 此 ,依照 自己 
对 拍卖 品 的 估价 而 真实 出 价 是 一 个 弱 占 优 策 略 。 


5.4 多 人 投票 : 弃权 诚实 还 是 策略 


在 一 个 共和 国 里 ,保护 社会 成 员 不 受 统治 者 的 压迫 固然 重要 ,保护 某 一 部 分 社会 成 员 
不 受 其 他 成 员 的 不 正当 对 待 ,同样 重要 。 在 不 同 的 社会 成 员 之 间 一 定 存 在 不 同 的 利益 ,如 
果 大 部 分 成 员 联合 起 来 ,那么 少数 群体 的 权利 就 会 得 不 到 保障 。 

一 一 麦迪 过 ( 美 国政 治学 家 ) 

上 一 节 将 仅 一 人 拥有 私人 信息 的 情景 延伸 至 双方 都 拥有 私人 信息 。 本 节 将 讨论 更 一 
般 的 情景 ,使 参与 者 数量 多 于 两 个 ,进而 探讨 另 一 些 更 有 现实 意义 的 模型 。 

人 类 社会 一 经 出 现 便 存 在 选择 的 问题 ,如 重要 职位 的 人 选 ,政策 的 制定 甚至 是 国家 政 
治 体制 的 确定 等 。 一 般 来 说 ,这 些 问 题 的 解决 主要 有 4 种 方式 , 即 社会 传统 习惯 \ 个 人 或 
集团 的 专制 独裁 .投票 表决 和 被 称 之 “看 不 见 的 手 ” 的 市 场 机 制 。 

就 制度 而 言 , 社 会 选择 的 主要 方式 是 投票 制度 与 市 场 机 制 。 在 德国 .法国 以 及 北 
欧 诸 国 ,投票 制度 使 用 范围 极其 广泛 ,常常 直接 或 间接 地 通过 投票 做 决策 而 较 少 采 
用 市 场 机 制 。 实 际 上 ,市场 机 制 也 是 投票 的 一 种 特殊 形式 一 一 在 市 场 机 制 中 选票 就 
是 货币 。 

在 政治 经 济 生活 中 存在 多 种 类 别 的 投票 。 既 有 选举 投票 和 表决 投票 ,又 有 匿名 投票 
和 实名 投票 ; 既 有 排序 制 投票 ,又 有 积分 制 投票 。 在 纷繁 复杂 的 投票 现象 中 ,投票 机 制 如 
何 影响 参与 者 行为 和 投票 结果 ? 要 回答 这 一 问题 还 需要 从 投票 者 的 行为 互动 说 起 。 本 节 
将 选取 两 种 投票 机 制 , 让 读者 在 学 习 贝 叶 斯 均衡 的 同时 又 能 理解 投票 机 制 的 作用 方式 。 
第 一 种 投票 机 制 是 多 人 同时 投票 ,而 第 二 种 是 议程 表决 。 
5 殉 ; 游戏 与 实验 

目前 ,全 国 各 大 城市 正在 进行 历史 名 人 评选 ,被 选 出 的 名 人 将 用 于 该 市 的 形象 宣传 。 
假设 你 作为 北京 市 的 一 员 , 也 有 义务 投 出 自己 的 一 票 。 当 你 到 达 现 场 后 ,看 到 候选 名 单 上 
列 有 : 庄子 , 范 仲 海 , 伍 子 表 , 霍 去 病 , 梅 兰 芳 , 僧 一 行 , 李 林 甫 , 徐 阶 , 孙 思 邀 ,韩非子 , 班 
昭 , 惟 政 。 无 论 对 名 人 了 解 与 否 , 都 到 此 为 止 ,不 允许 再 搜索 查询 。 要 求 有 二 : 

(1) 请 选 出 至 多 3 名 在 北京 出 生 或 成 长 的 历史 名 人 。 

(2) 知名 度 高 ,形象 佳 ,形象 不 佳 者 将 被 强制 删 去 。 

若 你 选中 的 名 人 符号 要 求 且 最 终 当 选 , 则 你 将 得 到 实验 成 绩 100 分 ; 车 你 选中 的 名 
人 不 符合 要 求 但 最 终 当 选 , 则 你 得 一 100 分 ; 其 他 情况 得 0 分 。 
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上 引 语 故 事 : MH17 航班 坠毁 


2014 年 7 月 17 日 ,马来西亚 航空 公司 一 架 载 有 298 人 的 波音 777 客机 , MHI17 航 
班 ,在 靠近 俄罗斯 边界 的 乌克兰 东部 地 区 坠毁 。 时 隔 一 年 后 ,联合 国安 理会 于 2015 年 7 
月 29 日 投票 否决 了 由 马来西亚 等 国 提出 的 、 建 立 一 个 针对 马 航 MH17 航班 险 毁 事件 国 
际 刑事 法 庭 的 决议 草案 。 

安理会 当天 就 马来西亚 等 国 提交 的 这 一 决议 草案 进行 表决 ,结果 是 11 票 赞成 .1 票 
反对 、3 票 弃 权 。 中 国 、 安 哥 拉 和 委内瑞拉 投了 弃权 票 。 投 反对 票 的 俄罗斯 表示 , 马 航 
MH17 航班 坠毁 事件 并 没有 被 国际 社会 列 为 对 国际 和 平安 全 构成 严重 威胁 的 事件 ,为 此 
成 立国 际 仲裁 组 织 不 在 安理会 职权 之 内 。 而 中 方 解 释 投 弃权 票 的 原因 主要 是 “安理会 成 
员 对 草案 存在 着 不 同意 见 ,强行 推动 表决 ,只 能 造成 安理会 成 员 的 分 裂 。 这 对 调查 真相 无 
六 多 0 

让 我 们 翻 开 史诗 巨著 ( 冰 与 火 之 歌 ), 管 中 突 豹 ,领略 列 王 的 纷争 : 

七 国之 王 劳 勃 。 拜 拉 席 思 意 外 亡故 ,临终 所 留 遗 蝇 “ 吾 之 合法 继承 人 乔 弗 里 "引发 
王室 剧变 。 王 子 乔 弗 里 看 似 应 该 合情合理 继承 王位 , 却 爆 身 世 丑 阔 : 王子 实则 王后 私 
生子 并 非 先 王 所 生 , 但 先王 已 逝 ,血脉 已 无 法 盖 棺 定论 。 王 弟 史 坦 尼斯 戏 勇 善战 , 若 王 
子 身世 丑 闭 成 真 , 他 身 为 死去 的 七 国之 王 劳 勃 的 长 弟 , 是 铁 王 座 合理 合法 的 第 一 顺 位 
继承 人 。 

先王 亡故 ,七 国 的 暗流 涌 动 变 成 惊涛骇浪 , 列 王 的 纷争 就 此 拉 开 序幕 。 谁 将 问 易 王 
位 ,不 仅 在 于 各 方 势力 的 靠拢 ,更 取决 于 议会 元 老 的 干 旋 。 因 此 首相 奈 德 .财政 大 臣 贝 里 
席 、 情 报 总 管 瓦 里 斯 ,此 三 人 之 选择 至 关 重 要 。 

先王 在 时 , 乔 弗 里 一 直下 为 王子 , 虽 性 情 骄 横 但 行为 并 无 不 端 ,身世 之 这 也 从 未 有 所 
泄露 , 值 此 关头 的 身世 攻击 似乎 也 无 法 印证 ,所 以 乔 弗 里 处 于 守 势 ; 而 挑战 他 的 叔父 史 坦 
尼斯 则 寒 言 沉闷 、 勇 猛 刚才 , 绝 不 会 做 出 任何 让 步 , 因 此 势必 力 取 。 但 过 往 历史 不 能 说 明 
问题 ,到 底 谁 能 成 为 “七 国之 王 ” 还 要 看 日 后 能 否 造福 七 国民 众 。 

在 表明 立场 的 关头 ,我 们 假设 首相 奈 德 .财政 大 臣 贝 里 席 、 情 报 总 管 瓦 里 斯 3 位 元 老 
拥有 绝对 权威 。3 个 人 需要 几乎 同时 做 出 决定 一 一 这 类 似 于 现代 的 委员 会 投票 ,每 人 匿 
名 做 出 自己 的 表决 ,最 后 公布 投票 结果 。 如 果 元 老 议 会 选 出 了 最 能 胜任 的 国王 , 则 每 人 得 
益 为 1, 否则 ,得 益 为 0。 

私生子 丑闻 爆发 之 前 ,国王 的 不 二 人 选 是 王子 乔 弗 里 。 至 于 史 坦 尼斯 ,议会 元 老 中 有 
些 人 对 其 以 往 表 现 有 所 了 解 ,而 有 些 人 却 知 之 甚 少 。 因 此 ,对 于 不 知情 的 元 老 们 而 言 , 史 
坦 尼斯 是 否 更 能 胜任 国王 显然 是 未 知 的 (不 完全 信息 ) 。 同 时 ,对 于 每 个 元 老 而 言 ,其 他 元 


@ 资料 来 源 : 凤凰 网 : http://news. ifeng. com/a/20150730/44304572_0. shtml. 
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老 是 否 了 解 史 坦 尼 斯 也 是 未 知 的 (不 完全 信息 ) 。 在 这 里 ,可 以 看 到 没有 绝对 的 正确 与 否 ， 
或 者 谁 应 该 胜出 的 问题 。 在 选 定 继承 人 的 过 程 中 , 既 有 投票 人 对 接近 事实 真相 的 努力 ,又 
有 投票 人 之 间 相 互 作用 的 结果 。 实 际 上 ,在 大 多 数 投票 机 制 中 ,投票 人 的 相互 作用 都 不 容 
小 现 。 通 过 梳理 ,你 会 发 现 该 博弈 中 存在 两 种 类 别 的 不 确定 性 : 史 坦 尼斯 是 否 更 能 胜任 ， 
以 及 其 他 元 老 是 否 了 解 史 坦 尼斯 。 
因此 ,每 位 元 老 都 存在 两 种 可 能 类 型 : 了 解 史 坦 尼斯 和 不 了 解 史 坦 尼 斯 。 对 于 任意 
一 位 元 老 , 他 的 类 型 既 可 能 是 了 解 史 坦 尼斯 ,也 可 能 是 不 了 解 史 坦 尼斯 。 但 这 是 他 的 私有 
信息 ,其 他 元 老 并 不 知晓 。 不 妨 假设 ,他 了 解 史 坦 尼斯 的 概率 为 g, 不 了 解 的 概率 为 1 一 q。 
3 位 元 老 均 是 如 此 。 
如 果 某 一 位 元 老 不 了 解 ,他 就 无 法 准确 地 断定 史 坦 尼斯 是 否 胜任 。 假 设 他 认为 王子 
乔 弗 里 更 能 胜任 的 概率 为 p。 既 然 乔 弗 里 能 被 国王 选中 ,不 妨 假设 1/2 二 p 二 1。 相 反 , 史 
坦 尼斯 更 能 胜任 的 概率 则 为 1 一 p。 毫 无 疑问 ,如 果 该 元 老 了 解 史 坦 尼斯 ,他 就 会 知道 选 
谁 更 好 ; 如 果 不 了 解 , 则 选择 王子 乔 弗 里 ,因为 此 时 的 期 望 得 益 为 pX1l 二 (1 一 p)X0=p， 
大 于 选 史 坦 尼斯 时 的 得 益 pX0 十 (1 一 p)X1==1 一 p。 还 有 一 点 尚 需 说明 ,我 们 仅 考虑 
“ 谁 能 胜任 存在 着 客观 标准 ”的 情形 。 换 言 之 ,假设 有 两 位 元 老 都 了 解 史 坦 尼斯 ,那么 关于 
“ 谁 能 胜任 ”他 们 二 人 之 间 不 存在 主观 分 歧 。 
类 似 海 萨 尼 转 换 ,我 们 将 不 确定 性 都 交 由 “自然 "来 选择 。 首 先 , “自然 "决定 谁 更 能 胜 
任 , 意 即 王子 胜任 的 概率 为 p, 史 坦 尼斯 则 为 1 一 p; 其 次 ,自然 ?选择 每 位 元 老 的 类 型 。 
在 “自然 "决定 了 上 述 4 项 之 后 ,这 3 位 元 老 同 时 投票 。 至 此 ,就 完成 了 海 萨 尼 转换 。 
读者 可 以 自行 尝试 画 出 所 对 应 的 博弈 树 。 很 显然 ,我 们 已 经 将 不 完全 信息 静态 博弈 转换 
为 不 完美 信息 动态 博弈 。 该 博弈 的 一 个 特点 是 分 支 多 : 不 仅 * 自 然 ? 所 要 决定 的 分 支 多 ， 
而 且 参 与 者 数量 与 可 能 行动 不 止 两 个 。 元 老 们 的 可 能 行动 包括 “选择 乔 弗 里 “选择 史 坦 
尼斯 "和 “弃权 ”。 
为 了 分 析 方 便 , 我 们 姑且 把 列 王 的 纷争 表达 为 一 个 投票 推举 模型 。 
博弈 参与 者 : 议会 三 元 老 { 奈 德 \, 贝 里 席 、 瓦 里 斯 }。 
自然 赋予 的 概率 : 
乔 弗 里 更 好 的 概率 为 p。 
史 坦 尼斯 更 好 的 概率 为 1 一 户 。 
元 老 了 解 史 坦 尼 斯 的 概率 gq。 
元 老 不 了 解 史 坦 尼斯 的 概率 1 一 q。 
行动 : { 选 择 乔 弗 里 ,选择 史 坦 尼斯 , 投 弃 权 票 }。 
得 益 : 根据 投票 结果 , 选 对 正确 的 国王 则 得 益 为 1, 否 则 得 益 为 0。 
补充 : 在 两 个 候选 人 中 ,得 票 最 多 者 获胜 ; 暂 不 讨论 混合 策略 均衡 一 一 即使 有 混合 
均衡 ,我 们 也 认为 投票 时 不 能 写 为 50 中选 乔 弗 里 ,50 凶 选 史 坦 尼 斯 。 
在 这 个 贝 叶 斯 博弈 中 ,可 能 存在 多 个 均衡 。 为 了 降低 难度 ,我 们 仍然 只 是 验证 某 一 给 
定 策略 组 合 是 否 为 贝 叶 斯 纳什 均衡 。 假 设 议 会 元 老 志 虑 忠 纯 ,一 心 造福 七 国民 众 ,不 存 私 
心 ,那么 模型 就 是 对 称 的 。 鉴 于 此 , 仅 考察 对 称 策 略 组 合 。 
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第 一 ,如 果 元 老 了 解 史 坦 尼斯 ,那么 他 认为 谁 能 胜任 ,就 选择 谁 当 国王 。 例 如 , 若 奈 德 
认为 史 坦 尼斯 能 够 胜任 , 则 推举 他 ; 否则 ,推举 王子 。 这 是 一 个 弱 占 优 策略 。 原 因 有 以 下 
两 点 。 

(1) 当 贝 里 席 与 瓦 里 斯 的 投票 相同 时 ,投票 结果 已 经 确定 。 因 此 ,无 论 奈 德 选择 谁 ， 
都 不 影响 选举 结果 。 所 以 ,选择 自己 认为 能 胜任 的 人 。 

(2) 而 当 贝 里 席 与 瓦 里 斯 的 选择 不 同时 , 奈 德 的 投票 决定 谁 能 赢得 王位 。 此 时 ,做 出 
正确 的 选择 得 益 为 1 ,而 做 出 错误 的 选择 则 得 益 为 0。 所 以 奈 德 应 该 果断 地 把 票 投 给 他 认 
为 能 够 胜任 的 那个 人 。 

第 二 ,如 果 元 老 不 了 解 史 坦 尼斯 , 则 弃权 是 占 优 策 略 。 这 是 一 个 非常 有 意思 的 策略 ， 
它 违背 我 们 的 直观 。 但 仔细 分 析 ,你 就 会 发 现 它 符合 参与 者 的 理性 要 求 。 考 察 下 述 3 种 
策略 。 

(1) 元 老 选 择 王子 。 根 据 第 一 种 情况 的 分 析 , 可 知 此 时 的 策略 组 合 为 "如 果 了 解 史 坦 
尼斯 ,就 选择 自己 认为 更 能 胜任 的 人 选 ; 如 果 不 了 解 , 则 选择 乔 弗 里 ”。 不 妨 从 首相 奈 德 
的 视角 展开 分 析 。 这 看 似 一 个 理性 选择 一 一 如 前 所 述 , 在 自己 不 了 解 史 坦 尼斯 的 时 候选 
择 乔 弗 里 的 期 望 得 益 为 bz 之 1/2。 但 加 入 参与 者 的 互动 之 后 结果 将 有 变化 。 如 果 另 两 位 
元 老 的 选票 一 致 , 则 首相 的 选择 并 不 能 改变 最 后 结果 。 因 而 此 时 的 策略 是 弱 占 优 策略 。 
然而 ,如 果 另 两 位 元 老 的 选票 不 一 致 , 则 一 定 是 一 位 元 老 了 解 史 坦 尼斯 而 另 一 位 不 了 
解 92。 不 妨 假设 财政 大 臣 贝 里 席 了 解 史 坦 尼斯 。 由 于 贝 里 席 知 情 ,因而 能 够 做 出 正确 的 
选择 。 那 么 ,情报 总 管 瓦 里 斯 一 定 是 错误 的 。 由 于 瓦 里 斯 和 奈 德 一 样 类 型 ,所 采取 的 也 是 
同样 策略 。 因 此 ,在 此 情形 下 该 策略 是 一 个 劣 策略 。 上 述 推理 说 明 ,此 时 “选择 王子 "不 是 
贝 叶 斯 均衡 所 对 应 的 策略 。 

(2) 元 老 选择 史 坦 尼斯 。 可 以 证 明 , 此 时 所 对 应 的 策略 组 合 也 不 是 贝 叶 斯 均衡 。 证 
明 过 程 与 (1) 类 似 , 读 者 可 自行 完成 。 

(3) 元 老 选择 弃权 。 不 妨 假设 奈 德 采取 弃权 。 如 果 其 他 两 位 元 老 都 了 解 史 坦 尼斯 ， 
则 会 据 实 选 择 更 能 胜任 的 人 选 。 此 时 奈 德 的 选择 不 影响 投票 结果 。 如 果 只 有 贝 里 席 一 人 
了 解 史 坦 尼斯 , 则 贝 里 席 会 根据 自己 的 认识 进行 投票 ,而 奈 德 和 史 坦 尼斯 会 采取 弃权 。 此 
时 更 能 胜任 的 人 当选 。 如 果 3 个 人 都 不 了 解 史 坦 尼斯 , 则 他 们 都 将 采取 弃权 策略 。 此 时 
无 人 支持 史 坦 尼斯 ,因而 王子 乔 弗 里 作为 先王 的 指定 人 选 继承 国王 。 此 时 由 于 乔 弗 里 胜 
任 的 概率 大 于 0.5, 因 此 期 望 得 益 仍 然 是 最 优 的 。 由 此 可 知 , 该 策略 是 一 个 弱 占 优 策略 ， 
而 由 该 策略 所 组 成 的 对 称 策略 组 合 是 一 个 贝 叶 斯 纳什 均衡 。 

上 述 推理 过 程 给 出 了 弃权 票 策略 在 委员 会 投票 中 的 合理 性 。 也 许 读者 已 经 注意 到 ， 
弃权 票 只 是 在 一 定 条 件 下 才 出 现 的 结果 , 它 不 具有 普遍 意义 。 因 此 ,读者 在 实际 运用 中 不 
仅 应 关注 自己 对 表决 事项 的 科学 认识 ,而 且 还 应 关注 投票 者 之 间 的 策略 互动 ,关注 别人 的 
行为 。 


@ 实际 上 ,如 果 贝 里 席 和 瓦 里 斯 都 了 解 , 则 投票 一 致 ; 如 果 贝 里 席 和 瓦 利 斯 都 不 了 解 , 仍 然 投 票 一 致 
是 客观 标准 所 致 ,后 者 是 对 称 策 略 所 致 


前 者 
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让 我 们 回 到 现实 中 的 投票 ,大 多 数 投票 人 在 投票 前 并 不 清楚 两 种 选项 熟 优 热 劣 。 这 
种 情况 下 ,最 好 不 要 盲目 投票 。 在 某 些 条 件 下 ,弃权 票 也 许 是 一 种 理性 的 选择 。 仅 此 而 
论 ,我 国 在 联合 国 大 会 上 多 次 选择 弃权 票 也 是 有 一 定理 由 的 。 撤 开 政 治 见解 不 谈 , 如 果 不 
能 完全 确信 自己 对 一 个 政策 有 足够 的 了 解 ,那么 弃权 万 是 中 庸 之 选 。 

此 外 ,再 从 信息 的 角度 回顾 这 个 博弈 。 请 问 仅 了 解 乔 弗 里 的 信息 对 于 元 老 们 的 行为 
有 任何 影响 吗 ? 答案 是 没有 。 此 时 ,一 个 有 用 的 信息 应 该 包含 两 点 : 四 对 史 坦 尼斯 充分 
了 解 ; 加 对 乔 弗 里 充分 了 解 。 两 点 信息 整合 在 一 起 才能 给 投票 人 以 正确 指导 。 以 这 个 角 
度 审视 民选 : 如 果 一 个 候选 人 只 顾 展现 自己 宏大 的 政治 抱负 和 政治 才能 是 没有 意义 
的 一 一 他 还 应 该 关注 对 手 ,证明 自 己 比 别 人 强 。 通 过 将 自己 和 他 人 对 比 或 者 对 其 他 候选 
人 提出 批评 ,候选 人 才 可 以 向 选民 传播 有 决定 意义 的 信息 (这 个 信息 并 不 一 定 是 正确 的 )。 
这 也 是 政坛 上 各 类 政治 攻击 的 原因 所 在 。 


2 扩展 阅读 : 中 色 股 份 定 增 调 高 慕 投 回报 遭 投 弃权 票 


2014 年 7 月 10 上 日 ,中 色 股 份 发 布 公告 称 , 由 于 市 场 变化 ,中 色 股 份 对 此 前 披露 的 定 
增 方案 进行 调整 ,并 调 高 了 沈阳 机 械 和 盈利 预期 。 这 直接 遭 致 属于 第 二 大 股东 的 董事 和 监 
事 齐 权 , 认 为 上 述 项 目 投资 回报 率 需 要 进一步 认证 。 

定 增 方案 显示 ,此 次 莫 集 资金 中 的 8 亿 元 将 向 沈阳 机 械 增资 ,由 沈 冶 机 械 以 增资 资金 
实施 新 厂区 建设 和 技 改 升 级 项 目 ,总 投资 15.4 亿 元 , 意 在 形成 年 产 制 铝 设备 、 冶 金 设备 、 
通用 设备 等 287 台 套 的 新 厂区 建设 项 目 。 

2014 年 7 月 10 日 ,调整 之 后 的 定 增 方案 和 可 行 性 分 析 报告 显示 ,沈阳 机 械 项 目 届时 
将 形成 年 均 销 售 收入 为 19.9 亿 元 ,年 均 利润 总 额 2. 69 亿 元 ,年 均 净利 润 2 亿 元 ,项 目 投 
资 利润 率 13. 1% ,投资 回收 期 为 8.2 年 。 这 意味 着 ,调整 之 后 的 沈阳 机 械 项 目 被 预期 将 
有 更 高 收益 。 

在 7 月 9 日 举行 的 董事 会 上 , 实 到 9 名 董事 中 ,有 4 名 关联 方 董事 回避 表决 , 剩 下 5 
名 董事 中 ,对 定 增 方案 有 3 票 同意 ,2 票 弃权 。2 名 投 出 弃权 票 的 董事 认为 ,沈阳 机 械 新 厂 
区 建设 项 目 投资 回报 率 需 进一步 论证 , 故 选择 弃权 。 无 独 有 偶 , 在 7 月 10 日 的 监事 会 表 
决 中 ,3 名 监事 中 的 1 位 也 投 出 弃权 票 ,理由 与 投 弃权 票 的 董事 所 持 理由 类 似 。 了 


5.4.2 诚实 投票 还 是 策略 投票 


站 语 放 事 


眼看 五 一 假期 将 至 ,社会 学 专业 二 年 级 (1) 班 的 班 委 盒 加 焦虑 起 来 。 他 们 还 在 为 春游 
的 事情 犹 阴 不 决 。 为 了 给 同学 们 提供 全 体 参 与 .愉悦 美好 的 集体 活动 , 班 委 每 年 都 会 就 活 
动 形式 和 地 点 举行 投票 ,以 求 让 尽 可 能 多 的 人 感到 满意 。 去 年 , 班 委 曾 就 活动 地 点 举行 投 
票 ,请 每 位 同学 写 上 自己 的 中 意 地 点 。 而 投票 结果 却 非 常 分 散 , 如 某 些 地 点 只 有 2~3 票 ， 


@ 资料 来 源 : 每 经 网 . http://www. nbd. com. cn/articles/2014-07-11/848083. html. 
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甚至 1 票 ,而 有 些 地 点 却 有 10 多 票 。 即 便 如 此 ,最 高 得 票数 也 不 超过 全 班 人 数 的 1/3。 
最 后 临近 假期 才 匆 匆 选 定 了 得 票 最 高 的 地 点 。 虽 然 活动 非常 成 功 , 但 是 一 部 分 同学 的 “和 欲 
言 又 止 ? 却 让 班 委 心 有 不 甘 。 

为 了 使 支持 者 过 半 ,今年 班 委 改革 了 投票 程序 。 首 先 班 委 口头 征询 民意 , 列 选 6 个 
“最 想 去 的 地 点 ”。 然 后 根据 学 校 的 出 游 要 求 淘汰 3 个 。 目 前 只 剩 黄山 、 丽 江 和 故宫 3 个 
地 点 进行 两 两 角逐 。 班 委 制定 了 一 个 投票 日 程 。 首 先 就 黄山 和 丽江 进行 投票 ,结果 黄山 
胜 ; 然后 就 黄山 和 故宫 进行 投票 ,结果 故宫 胜 。 最 后 , 班 委 一 致 决定 去 故宫 。 可 是 临近 投 
票 结束 时 文体 委员 还 不 甘心 ,坚持 让 大 家 就 故宫 和 丽江 再 投票 一 次 ,以 检验 集体 决策 的 正 
确 性 。 结 果 却 让 人 大 跌眼镜 一 一 丽江 胜出 ! 这 次 投票 ,又 一 次 令 春游 陷入 僵局 。 

让 班 委 们 不 明白 的 是 ,明明 投票 得 出 的 结果 是 “故宫 胜 于 黄山 ,黄山 胜 于 丽江 ”, 为 何 
最 后 一 轮 却 又 是 “丽江 胜 于 故宫 ” 呢 ? 有 谁 中 途 变 卦 了 吗 ? 同学 们 到 底 有 没有 诚实 投票 ? 

在 就 某 一 事项 进行 表决 时 ,常见 的 机 制 是 简单 多 数 制 , 意 即 获取 多 数 人 支持 的 候选 事 
项 胜出 。 在 有 多 个 候选 人 参加 竞选 时 也 可 用 这 种 投票 机 制 ,此 时 投票 人 只 需 对 其 中 的 一 
个 人 进行 投票 。 至 于 弃权 票 或 者 废 票 是 否 应 计算 在 内 , 则 需要 另行 规定 。 此 时 得 票 最 多 
的 候选 项 (人 ) 获 胜 。 然 而 ,简单 多 数 投票 机 制 具 有 似是而非 的 特征 。 反 对 这 一 制度 的 人 
士 认 为 , 当 存在 多 个 候选 人 时 ,个 人 只 能 排列 出 对 不 同 候选 人 的 偏好 顺序 ,但 无 法 反映 出 
偏好 的 强度 。 例 如 ,在 一 个 有 六 七 位 候选 人 的 选区 ,投票 支持 后 面 几 位 候选 人 的 选民 的 声 
音 被 完全 忽视 了 。 他 们 还 批评 说 ,根据 这 一 制度 选举 产生 的 议会 议员 之 中 甚至 有 2/3 的 
人 没有 得 到 半数 以 上 支持 。 这 是 对 民主 的 嘲弄 ! 这 可 能 会 导致 所 谓 的 “投票 悖 论 ”, 以 及 
投票 交易 行为 。 

首先 发 现 这 一 现象 的 是 200 多 年 前 的 法 国 大 革命 英雄 孔 多 塞 (de Condorcet) 侯 示 。 
在 很 多 状况 下 ,所 投票 表决 的 事项 并 没有 客观 评价 标准 ,而 是 依赖 于 不 同 投票 人 的 个 人 偏 
好 一 一 这 与 5. 4. 1 节 的 情景 不 同 。 相 比 之 下 ,排序 复 选 制 似 乎 能 让 每 个 投票 者 的 意愿 都 
在 最 后 的 选举 结果 中 有 所 体现 。 循 此 思路 , 孔 多 塞 法 则 是 最 早 的 排序 式 投票 制度 。 所 谓 
排序 式 投票 制度 ,是 指 投 票 人 需 在 投票 时 表达 出 对 各 候选 人 的 偏好 次 序 。 存 200 多 年 前 
的 那个 时 代 , 孔 多 塞 能 提出 这 样 的 方法 显然 是 一 种 富有 创造 力 的 制度 创新 。 排 序 式 投票 
制度 发 展 到 现在 ,最 常见 的 形式 是 议程 表决 (agenda) 。 

考虑 一 个 具有 nn 个 委员 的 投票 委员 会 。 每 个 委员 对 3 个 候选 人 A、B、C 都 有 自己 的 
排序 。 假 设 偏 好 次 序 是 图 5-10 所 示 3 种 情形 中 的 任意 
一 种 。 对 于 任意 一 个 委员 ,他 是 类 型 i 的 概率 为 pi(i 二 ”最 中 意 
1,2,3)。 尽 管 每 个 委员 的 类 型 不 为 他 人 所 知 ,但 是 他 自 ”次 中 意 
己 非 常 清楚 。 此 外 ,对 于 每 个 委员 来 说 ,如 果 自 己 最 中 意 不 中 意 
的 候选 人 获胜 ,自己 得 益 为 1; 不 中 意 的 人 获胜 ,自己 得 
益 为 0; 否则 得 益 为 v(0 二 v=1)。 

让 我 们 考察 这 样 一 个 表决 议程 : 第 一 轮 就 A 和 B 进行 投票 ; 第 二 轮 就 上 轮 胜出 者 与 
C 进行 投票 。 接 下 来 ,我 们 要 向 读者 证 明 一 个 重要 事实 : 诸如 引 语 中 班 委 所 困惑 甚至 怀 


图 5-10 委员 们 的 偏好 次 序 类 型 
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疑 的 事情 并 非 那么 直观 。 具 体 而 言 ,即使 委员 们 的 偏好 相当 一 致 而 使 得 孔 多 塞 胜 者 了 显 
而 易 见 ,这 个 胜 者 也 不 一 定 能 够 毫 无 悬念 地 当选 一 一 只 要 这 个 委员 会 足够 大 。 
根据 逆向 归纳 思想 ,在 最 后 一 轮 每 个 委员 都 会 诚实 投票 , 意 即 依照 自己 的 偏好 次 序 进 
行 投 票 。 无 论 前 面 如 何 行动 ,在 最 后 一 轮 所 对 应 的 得 益 已 经 不 再 包含 下 阶段 的 预期 ,是 历 
史 行 动 的 结果 加 上 本 轮 的 得 益 。 既 然 历史 结果 无 法 改变 ,能够 改变 的 只 有 这 一 轮 的 得 益 。 
因此 ,最 后 一 轮 的 行动 只 影响 本 轮 得 益 。 既 然 如 此 ,在 最 后 一 轮 每 个 委员 都 将 依照 自己 的 
偏好 诚实 投票 一 一 无 论 第 一 轮 投票 结果 如 何 。 因 此 ,第 一 轮 应 该 如 何 投票 是 我 们 讨论 的 
重点 。 
类 型 2 的 行动 : 鉴于 每 人 都 在 最 后 一 轮 诚实 投票 ,因此 偏好 的 不 确定 性 意味 着 一 一 
在 第 一 轮 如 果 A 胜出 则 进入 A 与 C 的 PK, 如 果 B 胜 出 则 进入 B 与 C 的 PK。 这 种 PK 
的 结果 依赖 于 投票 委员 是 某 一 类 型 或 其 他 类 型 的 概率 。 然 而 , 撤 开 这 些 概 率 不 谈 , 具 有 偏 
好 次 序 BC 二 A 的 类 型 2 一 定 会 在 B 与 C 之 间 选 择 ,而 非 A 和 C 之 间 。 因 此 ,作为 共同 
知识 ,每 个 人 都 知道 类 型 2 的 占 优 行动 : 在 第 一 轮 会 选择 B。 
类 型 3 的 行动 : 对 类 型 3 的 分 析 有 些许 复杂 。 但 是 ,仍然 能 够 证 明 存 在 一 个 对 所 有 
的 类 型 3 一 致 的 策略 , 它 是 均衡 的 一 部 分 。 对 于 ) 个 委员 ,有 两 种 互 斥 的 情况 ， 
(1) 至 少 有 (2 十 1)/2( 含 ) 的 投票 人 不 是 类 型 3 。 
(2) 至 少 有 (十 1)/2( 含 ) 的 投票 人 属于 类 型 3 。 
任何 一 个 委员 都 不 能 确 知 委员 会 到 底 是 上 述 哪 种 可 能 。 如 果 情 况 (2) 成 立 , 则 无 论 第 
一 轮 如 何 投票 ,C 最 终 获 有 性。 反之, 如果 情 况 (1) 成 立 ,那么 又 存在 两 种 情况 : 若 B 在 第 一 
轮 胜 出 , 则 进入 与 C 的 PK, 有 一 半 机 会 在 第 二 轮 胜 出 ; 若 A 在 第 一 轮 胜出 , 则 A 也 有 一 
半 机 会 胜出 。 既 然 B 是 类 型 3 的 最 后 选择 ,那么 第 一 轮 投 给 A 是 所 有 类 型 3 的 占 优 行 
动 一 一 至 少 A 在 第 二 轮 有 机 会 胜出 。 
类 型 1 的 行动 : 既然 类 型 2 和 类 型 3 的 委员 都 有 自己 的 占 优 行动 ,而 类 型 1 仍 待 进 
一 步 分 析 ,那么 不 妨 针对 类 型 1 将 可 能 的 策略 简化 为 如 下 两 类 。 
Si: 如 是 类 型 1, 则 诚实 投票 给 A。 
如 是 类 型 2, 则 选 B。 
如 是 类 型 3, 则 选 A。 
Sz : 如 是 类 型 1, 则 策略 投票 给 B。 
如 是 类 型 2, 则 选 B。 
如 是 类 型 3, 则 选 A。 
所 谓 策略 投票 ,是 指 委员 们 的 投票 依赖 于 最 后 的 得 失 权 衡 ,而 非 自 己 的 偏好 次 序 。 如 
此 算 来 ,3 个 委员 共有 8 种 策略 组 合 。 重 申 一 下 本 节 的 宗旨 ,我 们 只 是 想 证 明 有 些 事情 看 
似 不 可 思议 却 有 着 内 在 的 逻辑 ,而 非 穷 尽 所 有 均衡 。 因 此 , 仅 考虑 两 种 可 能 性 : 
(1) 所 有 委员 在 第 一 轮 都 选择 S1, 即 所 有 类 型 1 的 委员 都 诚实 投票 。 


@ 将 所 有 的 候选 人 两 两 进行 PK, 如 果 存 在 一 个 候选 人 .能 够 在 “少数 服从 多 数 " 的 原则 下 PK 掉 其 他 所 有 候选 
人 ,那么 他 就 是 孔 多 塞 胜 者 。 
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(2) 所 有 委员 在 第 一 轮 都 选择 Sa, 即 所 有 类 型 1 的 委员 在 第 一 轮 选 择 策略 投票 ,而 在 
第 二 轮 诚 实 投票 。 

显然 ,这 两 种 可 能 性 都 是 对 称 的 策略 组 合 。 

首先 ,检验 第 一 种 策略 组 合 (S1,5S1,…,S1) 是 否 构 成 一 个 贝 叶 斯 均衡 , 亦 即 是 否 有 人 
存在 单方 面 偏离 的 动机 。 既 然 类 型 2 和 类 型 3 的 委员 都 选择 了 自己 的 占 优 行动 ,因此 没 
有 动机 偏离 。 唯 一 的 可 能 是 类 型 1 的 委员 转变 为 策略 投票 ,从 投 给 A 转 为 投 给 B。 当 然 ， 
还 有 一 个 重要 事实 是 : 只 有 在 A 和 B 的 支持 者 势均力敌 时 偏离 , 才 可 能 获得 正 的 得 益 ; 
否则 ,偏离 没有 任何 得 益 。 因 此 在 A 和 也 的 势力 失衡 时 类 型 1 的 委员 不 会 偏离 。 例 如 ， 
若 有 明显 超出 半数 的 委员 都 支持 A, 则 任何 一 个 类 型 1 都 没有 动机 单方 面 偏离 一 一 撤 开 
“故意 ”不 谈 。 

既 如 此 ,和 暂且 考虑 一 个 类 型 为 1 的 摇摆 委员 。 类 型 1 有 动机 偏离 A 的 条 件 是 恰 有 个 
对 方 阵营 成 员 是 类 型 2 一 一 如 果 其 他 委员 都 遵守 Si 策略 ,那么 投 给 B 的 委员 也 只 能 是 类 
型 2。 在 这 种 情况 下 ,一 个 委员 必须 权衡 如 下 两 个 选择 。 

选择 1: 如 果 摇 摆 委 员 转 向 投 也 , 则 需要 该 委员 连同 (7 一 1)/2 个 类 型 2 的 委员 在 第 二 
轮 投 票 中 联合 确保 BB 胜出 。 

选择 2: 如 果 摇 摆 委 员 坚 持 投 A, 则 结果 是 人 和 C 进一步 PK。 在 接 下 来 的 PK 中 ， 
如 果 在 第 一 轮 投向 A 的 支持 者 中 至 少 存在 1 个 类 型 3, 则 C 胜出 ; 否则 ,A 胜出 。 当 然 ， 
既然 其 他 委员 的 策略 不 变 , 那 么 其 他 (1 一 1)/2 个 A 的 初始 支持 者 不 可 能 是 类 型 2。 根 据 
贝 叶 斯 法 则 ,对 于 任 一 A 的 初始 支持 者 ,他 属于 类 型 3 的 (条 件 ) 概 率 为 pa3/(p1 十 p3), 而 
属于 类 型 1 的 概率 则 为 p1/(p1 十 p3)。 不 难 推 知 ,A 的 所 有 其 他 支持 者 都 是 类 型 1 的 概 
率 为 


pi I 


pl |~1z)= brs 
而 至 少 有 1 个 是 类 型 3 的 概率 为 


Cn 一 1)12 
plts |~12) 一 | | 

因此 ,只 要 摇摆 委 员 是 双方 胜 负 的 决定 性 一 票 , 那 么 选择 B 将 得 到 v, 而 选择 A 将 得 
到 一 个 期 望 收益 ,等 于 1 乘 以 p(n|~tz) 加 上 0 乘 以 plis|~t2)。 当 

s>| pi pe 
力 ] ps 
时 ,摇摆 委员 才 有 动机 从 诚实 投票 单方 面 偏离 , 即 由 投 A 转向 投 B。 注 意 到 0 二 v<1, 因 
此 只 要 n 足够 大 ,上 述 不 等 式 就 会 成 立 。 换 言 之 , 当 委 员 会 足够 大 时 ,“ 所 有 类 型 1 的 委员 
都 诚实 投票 ”将 不 再 构成 一 个 均衡 。 

其 次 ,考虑 第 二 种 策略 组 合 (S2 ,Ss,…,S2) 是 否 构 成 一 个 贝 叶 斯 均衡 ,其 中 类 型 1 的 
委员 采取 策略 投票 。 和 前 文 分 析 类 似 ,摇摆 委员 成 为 决定 性 一 票 的 条 件 是 : 一 定 存在 
(n 一 1)/2 个 其 他 委员 是 类 型 3。 同 上 ,让 我 们 来 比较 类 型 1 在 单方 面 偏离 时 的 两 个 选择 。 

选择 1: 如 果 摇 摆 委员 坚持 投 B, 则 也 将 胜出 一 一 因为 在 第 二 轮 投 C 的 类 型 3 只 
(n 一 1)/2 个 ,而 支持 也 的 则 包括 摇摆 委员 和 (m 一 1)/2 个 类 型 1 和 类 型 2。 
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选择 2: 如 果 摇摆 委员 转向 投 A, 则 又 是 一 场 A 和 C 的 PK。 在 第 二 轮 的 PK 中 ,如 果 初 
始 支持 也 的 都 是 类 型 1, 则 A 获胜; 反之 ,B 的 初始 支持 者 中 只 要 有 1 个 类 型 2, 就 会 出 现 C 
胜出 一 一 因为 他 会 加 入 类 型 3 而 支持 C。 对 于 BB 的 支持 者 , 既 知 不 是 类 型 3, 则 他 是 类 型 1 
的 (条 件 ) 概 率 为 p1/(p1 十 p2)。 所 以 ,所 有 B 的 初始 支持 者 都 是 类 型 ] 的 概率 为 


p1 Ca 一 1)/2 
力 1 十 二 | 


plu 一 人 =[ 


p1 (nO—1)/2 
而 至 少 存在 1 个 类 型 2 的 概率 是 1 一 | ] 。 


pb1itp2 
(n—1D/2 
显然 ,选择 BB 将 得 到 vo, 而 选择 A 的 期 望 得 益 是 1 乘 以 | 二 年; ] 。 比 较 可 
知 , 当 


和 | 4 


时 ,摇摆 委员 将 坚持 策略 投票 , 即 选 B。 当 足够 大 时 ,上 述 不 等 式 成 立 。 这 与 第 一 个 策略 
的 结果 一 样 : 当 委 员 会 足够 大 时 ,“ 所 有 类 型 1 的 委员 都 诚实 投票 "将 不 再 是 一 个 均衡 。 

可 见 , 当 委员 会 的 规模 足够 大 时 ,策略 投票 就 有 可 能 成 为 一 种 均衡 结果 。 通 过 上 面 的 
案例 不 难得 出 ,分 散 化 的 理性 行为 有 可 能 导致 拥有 "决定 性 一 票 "的 投票 人 背离 诚实 投票 ， 
转 而 采取 策略 投票 。 这 是 一 个 违反 直观 的 结果 ! 


2 扩展 阅读 : 阿 罗 悖 论 


2000 年 5 月 ,维基 百科 的 援 稿 人 发 起 了 一 次 使 用 排序 式 ( 孔 多 赛制 ) 的 投票 ,投票 的 
主题 为 是 否 要 在 人 物 词 条 里 使 用 特定 头衔 ,如 是 否 把 伊丽莎白 二 世 称 为 “殿下 ”, 是 否 把 金 
正 日 称 为 “伟大 领袖 等 。 在 这 次 活动 中 , 孔 多 塞 投票 制 暴露 了 它 的 一 个 致命 缺点 : 无 法 
摆脱 " 阿 罗 悖 论 "。 当 时 ,维基 百科 委员 会 给 出 了 5 个 方案 作为 候选 项 (鉴于 篇 幅 , 此 处 不 
列举 5 个 方案 的 具体 内 容 ) 让 选民 投票 ,结果 方案 1 打败 了 方案 4, 方案 4 打败 了 方案 3， 
而 方案 3 又 打败 了 方案 1, 没有 任何 一 个 方案 能 成 为 孔 多 塞 赢家 。 和 孔 多 塞 早 在 1785 年 就 
已 经 发 现 两 两 对 决 的 投票 制 可 能 产生 无 法 选 出 最 终 胜 者 的 循环 ,因而 人 们 也 把 “ 阿 罗 悖 
论 ” 叫 作 “ 孔 多 塞 悖 论 ”。 虽 然 这 种 循环 现象 出 现 的 概率 不 大 ,但 它 的 存在 也 着 实 让 使 用 孔 
多 塞 投 票 制 的 人 头 阁 。 对 此 , 孔 多 塞 给 出 了 自己 的 解决 方案 ,但 由 于 论述 实在 太 过 有 睡 涩 ， 
几乎 没有 几 个 人 能 理解 ,更 谈 不 上 运用 了 。 真 正 用 在 实际 生活 中 的 悖 论 消解 法 主要 是 考 
虑 到 既然 在 投票 悖 论 里 每 个 候选 者 都 有 被 击败 的 记录 ,那么 被 最 少 的 票数 击败 的 那个 候 
选 者 就 是 最 终 的 赢家 。 


5.5 信号 博弈 : 你 的 眼睛 背叛 了 你 的 心 * 
在 不 完全 信息 博 灾 中 ,一 个 参与 者 如 何 推断 另 一 个 参与 者 的 类 型 ,主要 依赖 于 他 所 观 


察 到 信息 。 因 而 ,作为 私有 信息 的 拥有 者 ,可 能 会 通过 发 送 某 些 信 号 向 其 他 人 传递 自己 的 
类 型 信息 一 一 这 种 信号 既 可 能 出 于 隐瞒 自己 的 类 型 ,也 可 能 为 了 显示 自己 的 类 型 。 进 一 
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步 而 言 , 这 种 信号 传递 既 可 能 是 主动 的 ,也 可 能 是 被 动 的 。 正 如 郑中基 的 一 首 歌 所 唱 : 你 
的 眼睛 背叛 了 你 的 心 ! 

战争 中 的 交战 双方 并 不 希望 对 手 知晓 自己 的 底细 ,因此 会 做 局 隐瞒 自己 的 作战 计划 
或 军事 实力 ; 拍卖 中 的 竞价 者 也 许 不 想 让 对 手 知 晓 自己 的 估价 及 至 出 价 ,因此 可 能 向 对 
手 透露 虚假 出 价 。 这 些 情景 中 的 参与 者 希望 通过 信号 来 隐藏 自己 的 类 型 ,从 而 引导 局 势 
向 自己 所 希望 的 方向 发 展 ,或 言 借 此 提升 自己 的 期 望 利益 。 

相反 ,隐士 可 能 希望 通过 上 肢体 语言 向 盟主 暗示 自己 并 非 高 手 ; 投票 者 也 许 会 借助 某 
些 行为 传递 自己 对 候选 人 的 意向 ; 恋爱 中 的 男女 会 通过 赠送 礼物 或 邀约 来 探测 对 方 是 否 
爱 自己 。 此 时 ,拥有 私有 信息 的 参与 者 想 借 由 信号 传递 自己 的 类 型 。 

恋爱 中 的 男女 为 何 通过 邀约 和 应 约 与 否 来 辨别 对 方 是 否 爱 自己 ,而 不 是 通过 诸如 身 
高 ,发 型 班级 等 信号 ? 一 个 简单 的 回答 是 : 后 者 不 能 有 效 分 离 爱 与 不 爱 这 两 种 类 型 。 
“此 地 无 银 三 百 两 ”为 何 没有 隐瞒 * 此 地 埋 银 ”的 事实 ? 因为 这 样 一 句 声明 没 能 成 功 地 将 两 
种 事实 混淆 。 

在 介绍 本 节 的 信号 博弈 时 ,需要 你 慢 慢 体会 如 下 两 点 : 首先 ,私有 信息 拥有 者 是 出 于 
自 利 才 通过 信号 传递 自己 的 类 型 信息 ,即便 这 种 信号 传递 可 能 更 有 利于 对 方 。 其 次 ,对 于 
给 定 的 信号 ,其 他 类 型 的 参与 者 不 必要 模仿 发 送 ; 换言之 ,该 信号 的 发 送 者 能 够 借 此 将 自身 
类 型 与 其 他 类 型 有 效 分 离 ,或 者 有 效 谈 蔽 自身 类 型 ,而 其 他 类 型 参与 者 则 没有 动机 这 样 做 。 


5.5.1 何谓 信号 博弈 


知己 知 彼 , 百 战 不 歼 。 
一 《和 孙子 兵法 。 谋 攻 篇 》 

在 动物 界 ,雄性 动物 为 了 求偶 往往 不 遗 余力 地 表现 自己 。 孔 省 通过 开 屏 来 展现 自己 
羽毛 的 美丽 ; 在 蛙 鸣 比赛 中 , 叫 声响 亮 的 青蛙 能 得 到 更 多 的 交配 机 会 ; 华美 极乐 鸟 往往 
通过 优美 的 舞蹈 获得 异性 的 青睐 。 细 细 观 察 , 你 会 发 现 动物 界 的 许多 求偶 行为 与 繁殖 能 
力 或 强壮 程度 并 无 直接 关系 ,但 它们 确实 是 动物 决定 谁 将 被 青睐 的 信号 。 

在 人 类 社会 中 也 存在 类 似 的 现象 。 奢 侈 品 虽 然 “ 奢 侈 ”, 却 长 盛 不 衰 ; 青年 男女 在 聚 
会 中 喜欢 高 谈 阀 论 或 附庸 风雅 ; 互 赠 礼物 看 似 无 关 紧 要 , 却 是 人 际 交 往 中 非常 重要 的 一 
个 环节 ; 大 学 生 在 就 业 前 忙于 各 种 考证 和 培训 ; 等 等 。 这 些 看 似 累 缆 的 行为 , 却 有 着 非 
常 一 致 的 内 在 动机 : 利用 信号 传递 自己 的 类 型 。 

简单 而 言 ,男生 向 女生 表白 说 “1 love you”, 这 就 是 一 个 信号 传递 的 
过 程 。 然 而 ,只 有 表白 并 不 等 同 于 真爱 。 女 生 并 不 确定 男生 是 真心 喜欢 
还 是 才 场 作 戏 。 处 于 恋爱 中 的 人 是 敏感 的 ,也 是 需要 理性 注入 的 。 这 里 
不 仅 有 两 性 吸引 ,还 有 所 谓 的 博弈 , 即 通过 信号 传递 自己 的 类 型 以 及 甄 
别 对 方 的 真实 类 型 .信念 其 或 策略 ?等 。 


@ 请 读者 注意 ,博弈 分 析 只 是 在 讨论 年 轻 人 恋爱 时 众多 视角 中 的 一 个 ,其 中 会 涉及 策略 和 自 利 。 坦 白 来 讲 , 这 
些 内 容 并 不 利于 感情 的 培育 。 从 社会 学 ,心理 学 以 及 伦理 学 等 方面 也 有 诸多 讨论 ,在 此 建议 读者 不 要 间 于 博弈 ,特别 
是 非 合作 博弈 的 思想 。 实 际 上 ,这 种 建议 也 可 推 及 亲缘 关系 和 朋友 关系 的 处 理 上 。 
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除了 信号 传递 外 ,还 有 信息 甄别 , 即 通过 对 方 发 送 的 信号 来 识别 他 的 类 型 。 周 瑜 需要 
识别 蔡 琢 、 张 允 是 否 真 投降 ,曹操 也 同样 需要 明 察 黄 盖 何 以 临阵 变节 ; 君王 需要 从 各 种 互 
相 攻 计 的 奏章 中 明辨是非 ; 年 轻 人 更 需要 从 热烈 表白 中 探 明 对 方 是 否 真 爱 自己 。 这 些 都 
属于 信息 甄别 的 范围 。 

无 论 是 信号 传递 还 是 信息 甄别 ,都 是 信号 博弈 的 一 部 分 。 信 号 博弈 作为 一 种 特殊 的 
不 完全 信息 动态 博弈 在 经 济 学 应 用 中 引起 了 广泛 关注 。 它 的 基本 特征 是 : 参与 者 分 为 信 
号 发 出 方 和 信号 接收 方 两 类 ,先行 动 者 为 信号 发 出 方 .而 后 行动 者 为 信号 接收 方 ; 同时 ， 
先行 的 信号 发 出 方 的 类 型 是 私有 信息 ,而 后 行 的 信号 接收 方 的 类 型 是 共同 信息 。 显 然 , 尽 
管 后 行 的 信号 接收 方 具 有 不 完全 信息 ,但 他 可 以 从 先行 的 信号 发 出 方 的 行为 中 获得 部 分 
信息 ,信号 发 出 方 的 行为 对 信号 接收 方 来 说 具有 传递 信息 的 作用 。 在 这 种 博弈 中 ,后 行动 
者 主要 关心 的 是 先行 动 者 的 类 型 可 能 是 什么 ,而 先行 动 者 也 知道 这 一 点 。 因 而 对 于 某 些 
类 型 的 先行 动 者 而 言 “ 亮 明 身份 ”也许 会 更 好 。 因 而 他 可 能 有 动机 告诉 后 行动 者 他 的 真 
实 类 型 。 或 者 相反 ,他 可 能 会 试图 欺骗 后 行动 者 ,努力 发 布 信息 隐匿 自己 的 类 型 。 也 许 有 
人 会 问 ,先行 动 者 为 何不 直接 告诉 对 方 自己 的 类 型 ? 举 个 例子 你 就 明白 了 。 在 法 庭 上 一 
个 被 告 始终 坚 称 自己 无 罪 。 但 是 这 不 足 信 ,因为 无 论 是 否 有 罪 ,都 不 能 排除 会 这 样 做 。 因 
此 ,还 需要 更 多 的 信息 来 判断 。 例 如 ,不 在 场 证 据 、 无 犯罪 记录 ,甚至 不 经 意 的 眼神 或 动作 
等 。 言 语 声 明 的 确 是 一 种 信号 传递 过 程 ,但 此 外 还 有 很 多 。 这 是 一 个 很 有 意思 的 话题 。 

接着 这 一 话题 讨论 。 既 然 “ 听 其 言 " 的 可 信 性 不 足 , 那 么 可 尝试 * 观 其 行 "。 具 体 而 言 ， 
先行 动 者 需要 做 出 某 些 行动 上 的 努力 ,这 种 努力 会 使 他 承担 一 定 的 成 本 。 仅 当 他 是 某 些 
类 型 时 ,这 种 成 本 才 会 发 生 。 和 否则 ,他 将 不 会 承担 这 种 成 本 。 当 然 , 收 益 也 会 不 同 。 我 们 
称 这 种 成 本 支付 是 一 种 信号 。 通 过 它 ,先行 动 者 能 告诉 后 行动 者 他 的 真实 类 型 。 例 如 ,在 
招生 研究 生 时 ,有 些 高 校 难以 辨别 学 生 的 真实 水 平 ,就 选择 让 所 有 候选 者 参加 夏令 营 。 这 
样 能 够 通过 学 生 完 成 指定 任务 的 表现 来 加 以 区 别 。 当 然 ,说 谎 者 也 可 以 发 出 信号 ,并 让 接 
收 方 难以 准确 判断 其 真实 类 型 一 一 如 果 这 样 做 对 先行 动 者 有 利 可 图 的 话 。 辟 如 ,为 了 挤 
进 高 能 力 群 体 , 有 些 人 就 不 惜 文凭 造 假 。 原 因 在 于 ,文凭 是 一 种 需要 支付 高 昂 成 本 的 信 
号 。 不 同 能 力 的 人 对 这 种 成 本 的 承受 力 不 同 。 所 以 .雇主 就 可 通过 文 途 来 判断 雇员 的 能 
力 并 据 此 支付 不 同 的 薪水 。 那 么 ,有 些 人 就 会 采用 文凭 造假 而 隐藏 自己 的 真实 类 型 。 

一 旦 信息 不 完全 ,或 者 人 们 只 能 获得 有 限 信息 ,博弈 就 变 得 扑朔迷离 ,也 更 加 有 趣 。 
主要 原因 在 于 : 有 限 信息 对 人 们 的 理性 推理 提出 了 更 高 的 要 求 : 人 们 也 总 会 不 断 地 操纵 
信息 以 谋取 更 多 好 处 ; 而 就 在 人 们 操纵 信息 的 行为 中 ,又 往往 蕴含 着 某 些 信息 ,使 得 他 们 
的 对 手 可 以 根据 这 些 新 增 的 信息 更 新 其 信念 ; 对 手 信念 更 新 导致 的 策略 变化 反 过 来 又 会 
影响 人 们 的 信息 操纵 行为 …… 最 终 ,参与 者 的 行为 不 仅 需 要 满足 策略 的 均衡 ,还 需要 满足 
信念 的 均衡 。 完 全 信息 博弈 ,只 需要 浅 层 的 策略 互动 ; 不 完全 信息 博弈 , 则 涉及 策略 和 信 
念 双 重 互动 的 深层 谋略 。 概 而 论 之 ,可 将 不 完全 信息 博弈 归纳 为 以 下 几 类 。 

(1) 与 自然 博 讲 。 即 个 人 面临 不 确定 环境 时 的 决策 , 亦 即 第 1 章 中 所 提 及 的 单 人 博 
弈 。 这 本 属于 “决策 论 ” 的 内 容 。 但 由 于 不 确定 环境 可 以 看 作 自 然 确定 地 选择 某 个 结果 而 
另 一 参与 者 没有 观察 到 自然 的 选择 ,从 而 决策 问题 可 以 转化 为 自然 先行 的 不 完美 信息 动 
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态 博弈 加 以 分 析 。 

(2) 信和 号 传递 (显示 ) 和 信和 号 阻止 。 在 某 些 状况 下 ,信息 优势 方 发 现 披露 其 类 型 有 利 
可 图 ,于 是 他 就 会 尝试 发 送 某 些 信号 以 求 对 方 察觉 。 如 果 信 息 弱 势 方 也 能 获 利 ,那么 他 就 
会 欣然 接受 信号 ; 否则 ,弱势 方 就 会 尽力 阻碍 对 面 的 信号 传递 。 

(3) 信号 甄别 和 信和 号 和 干扰。 在 某 些 信息 不 对 称 情 形 中 ,信息 弱势 方 有 动机 设法 提取 
信息 优势 方 的 私有 信息 ,这 就 是 信息 甄别 。 如 果 此 事 对 信息 优势 方 不 利 , 那 么 他 极 有 可 能 
进行 信号 干扰 和 隐藏 信息 ,使 得 对 方 难以 提取 有 效 的 信息 。 

(4) 道 向 选择 和 道德 风险 。 这 两 个 概念 在 第 4 章 中 已 经 介绍 过 。 如 何 避 免 这 两 种 现 
象 所 带 来 的 不 利 影响 是 经 济 学 家 致力 解决 的 一 个 主要 问题 。 由 此 所 带 来 的 激励 相 容 机 制 
设计 也 是 人 们 所 感 兴趣 的 一 个 方向 。 

(5) 拍卖 和 竞赛 。 这 是 不 完全 信息 博弈 的 一 个 重要 领地 。 拍 卖 和 竞赛 理论 刻画 了 这 
样 的 现实 : 人 们 常常 为 共同 的 目标 而 展开 竞争 ,那么 他 们 最 佳 的 出 价 策略 是 什么 ”拍卖 
或 竞赛 的 组 织 者 又 如 何 通 过 设计 拍卖 制度 或 竞赛 程序 来 获得 最 高 效率 或 保障 公平 ? 

上 述 5 种 情况 中 ,前 3 种 属于 隐蔽 信息 。 博 弈 的 问题 主要 来 源 于 不 了 解 对 手 的 类 型 。 
我 们 只 能 通过 信号 来 修正 对 对 方 类 型 的 推断 ,而 很 难得 到 准确 的 推断 一 一 因为 信号 可 能 
是 一 种 欺骗 的 结果 。 后 两 种 属于 隐藏 行动 ,博弈 的 主要 问题 在 于 不 能 观察 到 对 手 的 行动 。 
此 时 参与 者 不 能 通过 观察 对 手 的 行动 来 应 对 ,只 能 在 决策 之 后 通过 结果 来 推断 对 手 的 
类 型 。 

2 扩展 阅读 ; 阿 克 洛 夫 、 斯 宾 塞 与 斯 蒂 格 利 区 


就 信息 经 济 学 而 言 , 阿 克 洛 夫 是 最 早 提 出 信息 不 对 称 这 一 现象 的 人 。1970 年 ,他 在 
哈佛 大 学 经 济 学 期 刊 上 发 表 了 著名 的 《次 品 问题 ) 一 文 ,首次 提出 了 “信息 市 场 ”的 概念 。 
如 果 说 乔治 。 阿 克 洛 夫 研究 的 是 产品 市 场 上 的 信息 不 对 称 ,迈克 尔 。 斯 宾 塞 研究 的 则 是 
劳动 力 市 场 的 信息 不 对 称 , 而 约瑟夫 。 斯 蒂 格 利 蒋 进 一 步 把 信息 不 对 称 引 入 保险 市 场 和 
信贷 市 场 的 研究 ,并 且 在 诸多 领域 都 有 建树 。 在 信息 不 对 称 市 场 中 ,不 具备 信息 的 一 方 建 
立 何 种 机 制 来 筛选 私有 信息 的 拥有 者 ,从 而 实现 市 场 效 率 。 这 是 约瑟夫 。 斯 蒂 格 利 蒋 研 
究 的 重点 。 

约瑟夫 。 斯 蒂 格 利 英和 迈克 尔 。 斯 宾 塞 二 人 的 研究 不 同 之 处 在 于 : 迈克 尔 。 斯 宾 塞 
研究 的 是 不 同类 型 的 信息 私有 者 如 何 通过 信号 传递 把 自己 与 竞争 者 分 离 出 来 。 这 里 的 重 
点 是 信号 传递 。 而 约瑟夫 。 斯 蒂 格 利 英 则 是 说 明 没 有 私有 信息 的 人 如 何 设 计 机 制 来 进行 
信息 甄别 ,使 信息 私有 者 不 再 隐瞒 信息 和 行为 。 换 言 之 ,他 研究 了 如 何 设 计 一 个 分 离 不 同 
类 型 参与 者 的 机 制 , 以 便 提 高 市 场 效率 。 


5.5.2 信号 传递 : 恋爱 博弈 
口水 太 廉价 ; 而 行动 则 有 其 直接 代价 , 关 平 赢利 。 


一 一 迪克 西 特 
至 此 ,我们 已 经 对 信号 在 博弈 中 的 作用 有 所 了 解 。 但 仅 有 信号 的 概念 并 不 足够 ,信号 
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传递 才 是 博弈 过 程 的 内 核 。 若 一 个 女生 无 法 确认 追求 者 是 否 真 正 钟 情 于 她 ,就 需要 追求 
者 的 其 他 信息 来 判断 。 现 如 今 一 名 “我 爱 你 " 略 显 苍白 .行动 才 是 检验 真爱 的 唯一 标准 。 
而 对 于 一 个 男生 而 言 , 若 他 情 深 似 海 却 不 善 表 达 , 甚 至 会 弄巧成拙 ,最 终 “ 友 达 以 上 ,恋人 

一 见 钟 情 可 遇 不 可 求 , 但 任 然 心动 总 在 发 生 。 而 内 心 的 暗流 漠 涌 ,只 是 自己 无 用 的 假 
想 。 将 自己 的 感受 传递 给 对 方 ,才能 让 感情 不 断 升 温 。 本 节 将 从 信号 传递 的 角度 ,分 析 亲 
密 关系 的 构建 过 程 。 也 许 , 它 能 给 你 一 些 启 示 。 


< 案例 分 析 : 少年 维特 初 识 夏 绿 攻 


我 们 跳 起 了 小 步 舞 ,一 对 对 旋转 着 ; 我 一 个 个 请 姑娘 们 跳 , 可 是 恰恰 是 那些 最 不 车 人 
喜欢 的 姑娘 偏偏 不 及 时 向 你 伸 出 手 来 ,做 出 结束 的 表示 。 绿 蒂 和 她 的 舞伴 开始 跳 英 国 舞 
了 。 轮 到 她 来 跟 我 们 一 起 跳出 图 形 时 ,我 心里 那 份 懂 意 呀 ,你 是 会 感觉 到 的 。 你 一 定 得 看 
看 她 的 寿 姿 ! 你 看 ,她 跳 得 多 么 投入 ,她 的 全 部 身心 都 融入 了 舞蹈 ,她 的 整个 身体 非常 和 
谐 ,她 是 那么 授 逐 自在 ,那么 对 逸 潇洒 ,仿佛 跳舞 就 是 一 切 , 除 此 之 外 她 别 无 所 想 , 别 无 所 
感 ; 此 刻 , 在 她 眼前 其 他 一 切 都 消失 了 。 

我 请 她 跳 第 二 轮 对 姓 ; 她 答应 同 我 跳 第 三 轮 , 她 以 世界 上 最 真诚 的 态度 对 我 说 ,她 最 
喜欢 跳 德国 三 。 一 一 “ 跳 德国 生 时 ,原来 的 每 对 三 伴 都 要 在 一 起 跳 , 这 是 这 里 的 习惯 ,” 她 
接着 说 “我 的 舞伴 华尔兹 跳 得 不 好 ,倘若 我 免 去 他 跳 华 尔 效 ,他 会 感谢 我 的 。 与 您 配对 的 
那 位 姑娘 也 不 会 跳 , 而 且 也 不 喜欢 ,我 看 见 您 跳 英 国 且 时 旋转 得 很 好 ; 要 是 您 愿意 同 我 跳 
德国 舞 , 您 就 到 我 的 舞伴 那儿 去 征 得 他 的 同意 ,我 也 去 跟 您 的 舞伴 打 个 招呼 。 一 一 我 随即 
握 住 她 的 手 ,我 们 商定 , 跳 华 尔 艾 的 时 候 让 她 的 姓 伴 去 同 我 的 舞伴 聊天 。.…… 

一 节选 自 歌德 (少年 维特 的 烦恼 。 六 月 十 六 日 》 


在 两 性 关系 中 ,即便 是 青少年 ,也 会 涉足 一 些 仪式 性 的 .发 展 关系 的 行为 ,甚至 比 成 年 
人 更 甚 。 他 们 狂欢 、 约 会 .送礼 物 、 表 白 等 。 当 然 ,也 有 一 些 人 只 是 相互 “勾搭 "0。 两 性 关 
系 是 如 何 建立 发 展 的 ?例如 ,如 何 互生 爱 莫 、 增 强 信任 、 表 白 承 诺 等 ? 这 是 一 个 社会 学 问 
题 ,也 是 博弈 互动 问题 。 尽 管 很 多 人 已 经 认识 到 这 是 青春 期 的 两 性 文化 ,但 是 鲜 有 社会 学 
研究 关注 这 些 所 谓 的 “恋爱 行为 ”, 意 即 性 伴侣 确立 之 前 的 “发 展 关 系 ” 行 为 。 即 便 在 有 关 
恋爱 行为 的 社会 学 研究 中 ,大 多 关注 性 经 验 史 、 地 点 .情感 体验 等 实证 因素 ,而 很 少 关注 青 
少年 是 如 何 发 展 恋爱 关系 的 。 鉴 于 本 书 的 主要 读者 群体 是 在 校 大 学 生 , 正 处 于 青春 期 , 因 
此 本 书 特别 改编 了 Paik 和 Woodley(2012) 的 论文 “Symbols and investments as signals: 
Courtship behaviors in adolescent sexual relationships”, 以 此 作为 信号 传递 的 讲解 案例 。 

实际 上 ,恋爱 行为 是 两 性 关系 发 展 走向 的 一 个 重要 信号 : 甜蜜 恩爱 、 着 场 作 戏 其 或 直 
接 冷 场 。 而 且 , 这 种 信号 是 有 成 本 的 。 相 信 这 一 点 并 不 难 理解 。 之 所 以 能 够 实现 有 效 的 
信号 传递 ,其 原因 在 于 不 同类 型 的 参与 者 所 能 够 承受 的 代价 是 不 一 样 的 。 如 果 这 种 差异 


@ “勾搭 "一 词 译 自 英文 “hook up”。 在 美国 文化 中 “hook up" 指 青少年 之 间 并 非 情侣 的 亲密 关系 。 它 是 个 含混 
不 清 却 意义 丰富 的 词 , 既 可 以 指 亲 吻 或 调情 ,也 可 以 暗含 性 行为 等 。 
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足够 大 ,就 可 以 据 此 推断 信号 发 送 者 的 类 型 。 这 就 达到 了 所 谓 的 分 离 均衡 。 

1. 无 信号 传递 时 

图 5-11 所 示 为 在 没有 信号 传递 时 两 个 年 轻 人 的 约会 模型 。 在 二 者 的 相处 中 ,无 论 男 
性 或 女性 都 有 可 能 先行 动 , 借 机 发 展 二 人 的 关系 。 不 妨 假设 男性 先行 动 , 继 而 女性 做 出 反 
应 。 让 我 们 以 少年 维特 与 夏 绿 带 的 恋情 为 例 进行 分 析 。 尽 管 维特 与 夏 绿 蒂 的 相爱 有 可 能 
是 无 法 自拔 的 ,但 是 一 般 而 言 他 们 有 很 多 机 会 改变 自己 的 恋爱 路 径 。 因 此 ,请 给 他 们 机 
会 ,允许 他 们 在 相识 初期 重新 选择 。 维 特 发 现 自己 对 夏 绿 带 有 好 感 以 后 ,决定 要 不 要 投入 
成 本 (精力 ) 与 之 建立 恋爱 关系 。 此 处 所 讲 的 “投入 成 本 ”相对 宽泛 ,包括 金钱 、 时 间 、 地 位 、 
资源 ,激情 甚至 贞洁 和 名 声 。 如 果 维 特 没有 投入 , 则 双方 都 得 0。 如 果 维 特 投入 成 本 开始 
追求 夏 绿 带 , 则 夏 绿 带 需要 做 出 回应 。 在 很 多 情境 中 沉默 也 是 一 种 回应 。 夏 绿 带 可 以 选 
择 投 入 精力 开始 约会 ,也 可 以 选择 拒绝 。 


自然 


真诚 型 , p 迎合 型 ，1-p 


(Ri, PR) (S,T) (m1 13) (5,1) 


图 5-11 无 信号 传递 时 的 约会 模型 


但 是 ,即便 夏 绿 带 管 应 约会 ,也 不 能 排除 她 不 爱 维特 。 因 此 ,维特 除了 纠结 于 夏 绿 带 
是 否 接 受 , 还 需要 揣 度 夏 绿 带 的 类 型 : 真诚 型 人 格 . 还 是 迎合 型 人 格 。 如 果 夏 绿 带 是 真诚 
的 ,她 会 朝向 甜蜜 的 婚姻 关系 努力 。 否 则 .如 果 夏 绿 带 是 迎合 型 的 ,她 仍 有 可 能 投入 成 本 
与 维特 恋爱 。 但 她 是 不 爱 维特 的 ,可 能 会 利用 维特 或 者 只 是 排 遗 寂寞 。 此 时 ,只 有 祝愿 他 
们 渐 行 渐 远 ! 假定 真诚 型 人 格 的 概率 是 p, 迎 合 型 人 格 的 概率 是 1 一 p。 这 是 共同 知识 ， 
在 二 人 的 朋友 圈 里 都 有 相对 统一 的 认 知 。 

那么 ,二 人 的 关系 依赖 于 各 自 的 选择 ,以 及 夏 绿 带 的 类 型 。 各 种 行动 所 对 应 的 结果 以 
及 对 应 得 益 如 图 5-11 所 示 。 总 之 ,可 将 约会 模型 明确 如 下 。 

参与 者 : 维特 , 夏 绿 蒂 。 

夏 绿 蒂 的 类 型 : { 真 诚 型 (H) ,迎合 型 (ID)} ,其 中 自然 选择 了 H 的 概率 为 户 , 选 择 工 的 概 
率 为 1 一 p。 

行动 : 

第 1 阶段 ,自然 决定 夏 绿 蒂 的 类 型 。 

第 2 阶段 ,维特 决定 是 否 投入 。 

第 3 阶段, 夏 绿 带 决定 是 否 投入 。 
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得 益 : 如 图 5-11 所 示 。 

让 我 们 来 考虑 夏 绿 带 的 激励 约束 。 首 先 ,对 于 真诚 型 的 年 轻 人 而 言 , 谈 恋爱 总 是 好 过 
单身 ,单身 又 优 于 被 利用 。 无 论 如 何 ,被 利用 或 被 发 “好 人 卡 ” 都 不 是 一 件 令 人 愉悦 的 事 
情 ,总 有 负面 情绪 蒙 绕 其 间 。 其 次 ,对 于 迎合 型 的 年 轻 人 而 言 , 可 能 仅仅 为 了 得 到 对 方 的 
金钱 .地 位 等 利益 ,但 是 并 不 想 发 展 美 好 的 婚姻 关系 。 因 此 利用 对 方 或 逢 场 作 戏 好 过 相爱 
结婚 。 针 对 上 述 两 点 可 给 出 夏 绿 带 选择 投入 时 所 对 应 的 条 件 : 

[Raz > T>0>5,s, 


Uae >0 
其 中 第 一 式 中 S,s 同时 满足 小 于 0。 
而 对 于 维特 而 言 , 欲 使 其 愿意 投入 成 本 进行 约会 。 至 少 需要 满足 投入 时 的 期 望 得 益 
大 于 不 投入 时 的 期 望 得 益 , 亦 即 
Be (l= 0 = 0 
若 上 述 两 个 条 件 同时 成 立 , 则 有 
全 >:T 


BS | /R= 

上 述 条 件 被 称 作 激励 相 容 约束 。 它 意味 着 ,维特 和 夏 绿 蒂 的 激励 需要 同时 满足 才能 
使 得 二 人 达成 理想 均衡 : 追求 者 愿意 投入 ,真诚 的 被 追求 者 也 愿意 投入 。 这 是 一 个 贝 叶 
斯 均衡 ,姑且 称 为 “有 情人 终 成 眷属 "。 抛 却 策略 和 信念 不 谈 , 现 集中 讨论 第 二 个 条 件 。 只 
有 当真 诚 的 姑娘 在 人 群 中 超过 一 定 比 例 包 =1S|/CR1: 一 S) 时 , 才 有 年 轻 人 愿意 主动 邀约 ， 
投入 恋爱 。 和 否则 ,宁愿 单身 。 反 过 来 , 若 女生 先 追 求 男 生 ,结论 一 样 适用 。 

然而 ,p 二 p' 并 不 是 总 能 发 生 的 ,特别 是 当 被 利用 者 的 损失 S 特别 大 时 。 当 2< 记 时 ， 
信号 传递 将 是 非常 重要 的 一 步 。 当 校园 中 既 有 着 场 作 戏 者 和 莫名 求 利 者 ,又 有 感情 真 执 
者 和 孤芳自赏 者 时 ,真诚 型 人 格 的 年 轻 人 应 如 何 传递 有 关 自 己 类 型 的 信号 呢 ? 我们 又 该 
如 何 建 模 分 析 呢 ? 

2. 有 信号 传递 时 

尽管 在 实际 中 青年 男女 双方 都 存在 信息 私有 和 信号 的 发 送 与 接收 ,但 是 正如 我 们 所 
看 到 的 ,本 节 只 简单 讨论 了 被 追求 者 一 方 是 信息 私有 的 情况 ,追求 者 的 信息 是 公开 的 。 仍 
然 继续 这 一 思路 ,讨论 夏 绿 蒂 拥有 私有 信息 的 状况 。 夏 绿 蒂 作为 和 有 信息 拥有 者 ,需要 发 
送 有 关 自 己 类 型 的 信号 。 维 特 作 为 信号 接受 者 ,能 够 观察 到 相关 信息 。 

可 在 前 述 的 约会 模型 中 加 入 一 个 信号 传递 阶段 。 在 信号 传递 阶段 ,年 轻 人 可 预先 观 
察 到 相关 信和 号 ,然后 才 是 约会 模型 ,如 图 5-12 所 示 。 粗 略 地 讲 , 可 认为 信号 传递 发 生 在 确 
定 情 侣 关系 前 的 试探 期 。 有 些 人 的 试探 期 很 长 ,有 些 人 则 是 一 见 钟情 ,甚至 还 有 些 人 是 
“闪婚 ”。 无 论 如 何 , 试 探 期 青年 男女 的 活动 也 是 有 成 本 的 ,相信 读者 能 够 理解 这 一 点 。 试 
探 期 之 后 才 是 求爱 和 恋爱 阶段 。 

如 图 5-12 所 示 。 在 信号 传递 阶段 ,发 送 者 夏 绿 蒂 可 以 选择 发 送信 号 ,也 可 以 选择 不 
发 送信 号 ,分 别 记 作 C+ 和 C7。 若 不 发 送信 号 ,双方 都 没有 额外 的 成 本 发 生 。 如 果 发 送 


202 博弈 论 入 门 


真诚 型, p 迎合 型 ，1-p 
页 绿洲 页 绿营 
co RG a OS 
«< [ 弛 站 yy- “~ 维和 ~ 
投入 / \ 不 投入 投入 / \ 不 投入 投入 / \ 不 投入 投入 / \ 不 投入 
BE 页 绿 基 E 
(0.0) (0, 0) (0,0) (0, 0) 


投入 不 投入 投入 不 投入 投入 不 投入 投入 不 投入 


(RI-CI, (SCI， (Ri,R) (S$,n) (nC (oC, (nm GD 
RC) TC) mC) FC) 


图 5-12 加 入 信号 的 约会 模型 


信号 ,无 论 是 发 送 者 还 是 接收 者 ,都 要 承担 相应 的 成 本 。 当 满足 以 下 条 件 时 ,该 博弈 存在 
一 个 分 离 均衡 。 
人 >C 
R2:>>C>t 

在 均衡 状态 下 ,即便 有 成 本 发 生 , 追 求 者 仍然 愿意 形成 恋爱 关系 。 而 迎合 型 人 格 的 年 
轻 人 则 避免 发 送信 号 ,因为 此 番 做 法 并 无 利 可 图 。 所 以 追求 者 能 够 根据 他 是 否 愿 意 花 时 
间 以 相互 了 解 来 识别 其 类 型 。 相 反 , 如 果 试探 期 成 本 很 低 则 会 出 现 混同 均衡 ,无 法 识别 被 
追求 者 的 类 型 。 

至 此 ,读者 应 该 理解 了 不 完全 信息 博弈 中 信号 的 传递 过 程 。 至 于 该 博弈 的 均衡 求解 
及 相关 分 析 , 由 于 存在 一 定 难 度 , 故 略 去 不 谈 。 


EC 扩展 阅读 


在 针对 青少年 恋爱 行为 所 建立 的 约会 模型 中 (图 5-11 和 图 5-12) ,存在 着 几 个 可 被 实 
证 检验 的 性 质 。Paik 和 Woodley 在 上 述 约 会 模型 的 基础 上 ,利用 美国 全 国 青 少年 健康 研 
究 数据 进行 实证 考察 ,得 出 以 下 主要 结果 。 

首先 ,上 述 模型 表明 青少年 是 否 愿 意 形成 长 期 的 两 性 关系 与 他 们 的 恋爱 行为 之 间 存 
在 着 关联 。 特 别 是 当 恋 爱 成 本 非常 高 时 ,爱情 中 的 欺骗 和 利用 将 会 大 大 减少 这 是 由 
于 恋爱 期 间 的 信号 传递 分 离 了 两 种 类 型 的 人 群 。Paik 和 Woodley(2012) 主 要 从 经 济 与 
社会 的 角度 探讨 了 恋爱 行为 以 及 恋爱 中 迎合 型 群体 的 两 个 指 征 变量 : 理想 约会 关系 中 的 
性 行为 时 机 和 既往 性 伴侣 数量 。 

其 次 ,通过 表 5-11 可 见 , 恋 爱 行为 在 青少年 两 性 间 的 浪漫 关系 中 司空 见 惯 。 当 然 , 大 
部 分 的 恋爱 行为 发 生 在 具有 浪漫 关系 的 青年 男女 中 。 同 时 ,诸如 “结伴 出 去 ”两 人 单独 出 
去 “公开 拍拖 关系 ”等 社交 行为 又 是 最 盛行 的 。 相 反 ,诸如 “说 我 爱 你 “礼物 赠送 ”“ 少 见 
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其 他 朋友 ?之 类 的 骆 俩 行为 (dyadic behavior) 却 屈居 其 次 。 在 这 些 浪漫 关系 中 ,1/3 的 青 
少年 表示 有 性 行为 发 生 。 
表 5-11 变量 的 描述 统计 


变 量 均值 /概率 标 准 差 
恋爱 行为 
结伴 出 去 0.68 
两 人 单独 出 去 0.62 
见 对 方 父母 0.58 
公开 拍拖 关系 0.78 
少见 其 他 朋友 0.37 
交换 礼物 0.46 
告诉 对 方 “我 爱 你 ” 0.51 
性 交往 0.35 
性 体验 较 晚 (12 一 15 岁 ) 0.31 
性 体验 较 早 (11 岁 以 下 ) 0.10 
有 过 1 一 2 个 性 伴侣 0.12 
有 过 3 个 以 上 性 伴侣 0.06 
控制 变量 
男性 0.46 
黑人 0.19 
西班牙 裔 0. 16 
亚 裔 0.05 
年 龄 15. 87 
父母 受 教育 得 分 13. 34 2.38 
单亲 家 庭 0. 44 
抑郁 得 分 1.52 0.4 
青春 期 发 育 0.05 0.77 
GPA(Grade Point Average) 和 YY 0.76 
少年 犯罪 0. 03 0.54 
父母 监管 0.30 
与 父母 亲密 度 4. 22 0.55 
父母 放任 度 1. 80 0.87 
宗教 关怀 0.02 0.87 
童贞 宣誓 0.14 
一 次 浪漫 恋情 0. 45 
两 次 以 上 浪漫 恋情 0. 27 
浪漫 约会 兴趣 度 3.59 .07 


@ 资料 来 源 : 美国 全 国 青少年 健康 研究 (National Longitudinal Study of Adolescent Health) ,Waves LII,1994- 
1996, 共 选取 样本 4938 个 。Wave I 为 1994 一 1995 年 在 校 问卷 调查 ,样本 容量 为 90 118; Wave II 为 1995 一 1996 年 在 
家 受 访 调查 ,容量 等 于 14 738。 


204 博弈 论 入 门 


续 表 
变 量 均值 /概率 标 准 差 
伴侣 年 龄 差异 1.04 2.13 
不 同 种 族 间 恋爱 0.20 
伴侣 间 先 期 社交 连接 1.01 0.97 
种 族 隔离 指数 (3 638 个 样本 ) 0. 26 0.19 


进一步 ,Paik 和 Woodley 识别 了 4 种 恋爱 关系 类 别 : 很 少 联系 (minimal) 、 青 涩 发 展 
(going-with) 、 上 暧昧 交往 (social) 和 热恋 (extensive) ,如 表 5-12 所 示 。 首 先 发 现 ,热恋 占据 
了 所 有 两 性 浪漫 关系 的 38 听 ,是 占据 主导 地 位 的 一 个 。 同 时 ,在 所 有 恋爱 行为 中 ,每 一 种 
行为 出 现 的 条 件 概 率 都 非常 高 ,在 66% 一 100% 之 间 变 动 。 调 查 显示 ,这 一 类 别 的 青少年 
在 性 行为 发 生 之 前 经 历 了 许多 的 恋爱 行为 , 意 即 ,他 们 单独 或 与 亲友 共同 参加 社交 活动 、 
公开 拍拖 关系 、 表 达 爱 莫 ,然后 才 是 发 生性 行为 。 其 次 是 暖 昧 交际 型 关系 ,占据 了 22%， 
更 多 地 表现 为 同龄 认可 (peer oriented) 先 于 父母 认可 (parent oriented) 。 在 这 类 人 和 群 的 
恋爱 行为 中 ,结伴 出 去 \ 两 人 单独 出 去 和 公开 拍拖 关系 三 者 具有 较 高 的 条 件 概率 ,而 少见 
朋友 、 交 换 礼 物 、 表 达 爱 莫 的 条 件 概 率 都 很 低 。 表 明 在 性 关系 发 生 之 前 具有 较 弱 的 陪 俩 内 
聚 力 。 再 次 ,有 接近 1/4 的 浪漫 关系 属于 青 涩 型 ,其 中 结伴 出 去 、 公 开拍 拖 关 系 和 表达 爱 
莱 的 比例 都 很 高 。 但 是 ,诸如 其 他 社会 行为 和 路 俩 行为 却 概率 很 小 。 标 以 “ 青 涩 ”, 足 以 表 
明 这 些 年 轻 人 缺乏 经 验 , 但 正在 成 熟 。 最 后 是 很 少 联系 。 这 一 类 别 约 占 所 谓 浪漫 关系 的 
17%, 但 具体 行为 却 显著 不 同 于 另 三 个 。 性 行为 之 前 的 恋爱 行为 很 少 ,在 2% 一 23% 之 间 
变动 。 这 类 关系 有 些 类 似 于 现在 的 “网 约 开房 ", 实 际 上 能 够 建立 浪漫 关系 的 概率 并 不 高 。 
同时 , 它 也 反映 了 一 部 分 年 轻 人 将 “ 匀 搭 ”作为 建立 浪漫 关系 的 途径 。 可 见 , 这 些 类 别 也 正 
与 社会 认 知 和 道德 范式 基本 吻合 。 

表 5-12 4 种 恋爱 类 别 的 概率 分 布 和 具体 恋爱 行为 的 条 件 概率 


很 少 联系 青 涩 发 展 暧昧 交往 热恋 
恋爱 行为 条 件 | 标准 | 条 件 | 标准 | 条 件 | 标准 | 条 件 | 标准 
概率 | 误差 | 概率 | 误差 概率 | 误差 | 概率 误差 
结伴 出 去 0.23 | 0.03 | 0.61 0.04 0.77 | 0.05 | 0.89 0.01 
两 人 单独 出 去 0.08 | 0.03 0. 27 0.05 0.8 0.06 | 0.92 0.02 
见 对 方 父母 0.15 | 0.03 0.43 0.04 0.51 0.05 | 0.89 0.02 
公开 拍拖 关系 0.11 0. 03 0. 96 0.02 0.73 0.05 1 0 
少见 其 他 朋友 0.02 | 0.01 0.18 0.03 0.33 | 0.05 | 0.66 0.02 
交换 礼物 0.04 | 0.02 0.29 0.04 0.22 | 0.03 | 0.79 0.02 
说 “我 爱 你 ” 0.04 0. 02 0. 64 0.05 0.11 0.03 0. 84 0.03 
4 种 行为 的 概率 0.17 0. 23 0.22 0.38 


”资料 来 源 : 美国 全 国 青少年 健康 研究 (National Longitudinal Study of Adolescent Health) ,Waves I1,1995 一 
1996, 选 取样 本 4938 个 。 
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最 后 ,关于 迎合 型 年 轻 人 的 特征 ,可 通过 考察 其 指 征 变量 来 实现 。 我 们 简单 给 出 如 下 
结果 : 加 性 行为 越 旱 、 性 伴侣 越 多 ,陷入 热恋 行为 的 可 能 性 越 低 ; 回 陷入 热恋 行为 与 同居 
概率 上 升 之 间 正 相关 ; 回 热恋 行为 与 性 行为 之 间 的 相关 程度 主要 取决 于 进入 热恋 关系 的 
可 选择 性 。 


5.5.3 信号 传递 : 就 业 市 场 博弈 


在 生活 中 ,我们 经 常会 见 到 各 种 各 样 的 信息 传递 。 比 如 许多 大 学 都 会 披露 其 有 几 个 
院士 ; 教授 们 会 公布 自己 曾 在 重要 期 刊 发 表 过 多 少 学 术 论 文 ; 公司 会 公布 对 其 有 利 的 排 
名 结果 …… 为 什么 会 出 现 这 样 的 情况 呢 ? 这 就 要 用 到 本 节 的 信号 传递 知识 来 解释 。 

我 们 已 经 看 到 ,信号 传递 理论 最 早 是 由 经 济 学 家 迈克 尔 。 斯 宾 塞 提出 的 。 他 对 这 个 
问题 的 思考 起 点 是 MBA (工商 管理 硕士 ) 的 就 业 。 他 在 哈佛 大 学 读 博 士 时 ,发 现 那些 
MBA 学 生 在 进入 哈佛 大 学 之 前 也 没什么 了 不 起 ,但 是 毕业 出 去 之 后 就 能 比 教 授 多 挣 几 
倍 、 甚 至 十 几 倍 的 钱 , 他 就 开始 思考 这 究竟 是 为 什么 ”最终 他 研究 的 结论 是 教育 具有 
信号 传递 的 作用 , 受 教育 者 能 够 将 其 信息 “信号 ?可 信 地 传递 给 在 信息 上 具有 劣势 的 用 
人 单位 。 

斯 宾 塞 认为 教育 (如 文凭 及 证 书 ) 是 劳动 力 市 场 上 典型 的 信号 之 一 。 一 般 而 言 ,在 相 
同 的 周期 内 ,就 读 于 更 好 的 学 校 , 获 得 了 更 高 的 学 历 ,取得 了 更 高 的 学 位 ,拥有 更 多 的 资格 
证 书 的 学 生 , 会 比 其 他 人 拥有 更 强 的 能 力 。 所 以 ,教育 信号 高 的 人 ,具备 高 生产 率 、 低 信号 
成 本 的 特征 。 具 体 来 说 ,在 劳动 力 市 场 ,用 人 单位 总 是 希望 能 够 预先 获得 求职 者 的 实际 工 
作 能 力 方 面 的 信息 ,从 而 可 以 避免 逆向 选择 。 而 求职 者 的 某 些 特征 ,如 教育 、 工 作 经 验 等 
都 可 以 看 成 是 一 种 信号。 


< 引 语 故事 : 考 学 .考证 . 考 工 作 ? 


继 2013 年 “最 难 就 业 年 "2014 年 “更 难 就 业 年 ”2015 年 “最 难 就 业 年 ”之 后 ,2016 年 
的 冬天 又 被 称 作 "史上 最 难 毕 业 季 ”。 统 计 显 示 , 毕 业 生 在 刚 就 业 半年 内 的 离职 率 高 达 1/3， 
并 且 大 约 有 70 昕 的 企业 认为 “大 学 生 在 校 期 间 学 到 的 知识 实用 性 不 强 ”。2016 年 ,中 国 将 
有 1200 多 万 名 本 科 生 和 高 职 院 校 毕业 生 求 职 。 尽 管 中 国 有 如 此 庞大 的 劳动 力 资源 ,但 
不 少 雇 主 依然 很 难 找到 合适 的 人 才 。 到 底 该 如 何 认 识 这 种 现象 ,各 方 观点 莫衷一是 。 

大 学 生 小 孙 :“ 招 聘 会 上 人 满 为 患 ,用 人 单位 给 你 的 时 间 很 少 。 如 果 学 校 一 般 , 再 没 
有 几 个 像样 的 证 书 , 用 人 单位 就 会 把 你 拒 之 门 外 , 连 面试 的 机 会 都 不 给 你 ”其 实 , 不 仅 小 
孙 这 样 想 ,许多 面临 就 业 的 大 学 生 都 认为 ,在 招聘 会 上 能 给 用 人 单位 留 下 深刻 印象 的 ,就 
是 自己 的 毕业 院 校 和 考取 的 证 书 。 

大 学 生 小 王 :“ 由 于 考证 把 专业 课 都 耽误 了 ,现在 期 货 公 司 拒签 我 ,说 明 单 赁 考证 是 
不 行 的 ,最 重要 的 还 是 专业 综合 素质 。” 

王 钟 的 (中 国 青年 报 评论 员 ): 本 科 就 读 于 西北 普通 院 校 的 菜 学 生 , 工 作 两 年 后 , 考 上 
京城 一 所 名 校 的 硕士 研究 生 。 他 本 以 为 从 此 “迎娶 白 富美 , 走 上 人 生 颐 峰 ”, 却 在 找 工 作 时 
屡屡 碰壁 。 几 番 折 腾 下 来 ,他 发 现 问题 还 是 出 在 学 历 上 : 招聘 单位 不 仅 要 看 最 高 学 历 , 还 
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要 看 第 一 学 历 。 在 名 校 学 历 的 含金量 逐渐 被 稀释 的 当下 ,这 种 现象 是 “学 历 歧 视 ” 的 新 演 
绎 形式 。 

i 歧视 是 一 个 泛 化 的 表达 。 遭 遇 * 不 公 ? 时 ,人 人 都 想 舞 弄 几 下 反 层 视 大 棒 ,仿佛 那 
样 便 是 “政治 正确 ”。 但 是 ,在 很 多 情况 下 * 反 歧视 ”混淆 了 偏好 、 偏 见 与 歧视 3 种 情形 。 

有 人 会 摆 出 一 句 老话 ,说 所 谓 “ 学 历 歧 视 ” 让 一 些 有 能 力 者 失去 机 会 。 这 是 似是而非 
的 诡辩 。 在 一 所 好 大 学 上 学 ,享受 更 多 的 学 习 资 源 ,接受 良好 的 高 等 教育 ,难道 不 是 有 能 
力 的 体现 吗 ? 批评 一 些 用 人 单位 的 唯 学 历 论 , 是 因为 他 们 设置 了 过 高 或 者 不 必要 的 学 历 
门槛 ,比如 环卫 部 门 非 要 招 个 名 校 硕 士 等 。 然 而 , 借 此 贬低 名 校 学 历 的 价值 , 走 入 了 反 笨 
的 误区 。 

花 琴 ( 某 公 司 人 力 资 源 总 监 ) : 或 许 是 经 验 形 成 了 刻板 印象 ,作为 一 个 HR ,我 在 招聘 
时 更 倾向 于 选择 名 校 毕业 生 。 

就 拿 面 向 应 届 毕 业 生 招聘 的 管理 培训 生来 说 ,专业 的 限制 已 经 尽量 减少 ,那么 ,在 堆 
积 如 山 的 简历 里 ,如 何 确 定 面试 名 单 呢 ? 熟练 的 HR 可 以 5 秒 看 完 一 封 简历 , 略 过 基本 信 
息 和 自我 吹 鄙 的 个 人 介绍 ,有 料 的 应 该 就 是 毕业 院 校 、 校 内 外 实习 经 验 和 所 获 荣誉 了 。 往 
往 上 述 三 项 “ 硬 货 ”, 后 两 项 都 跟 毕 业 院 校 有 明显 的 关系 。 


劳动 力 就 业 市 场 是 一 个 典型 的 信息 不 对 称 市 场 ,对 于 求职 者 能 力 的 识别 比 一 般 商 品 
更 加 困难 。 用 人 单位 实际 上 永远 不 可 能 完全 搞 清楚 任何 一 位 求职 者 的 实际 生产 能 力 。 然 
而 ,如 果 按 照 平 均 劳 动 生产 率 来 支付 薪水 , 则 会 导致 高 生产 能 力 的 求职 者 退出 市 场 ,最 终 
形成 一 个 "柠檬 市 场 ”。 

假设 在 就 业 市 场 上 有 1 个 求职 的 毕业 生 和 1 个 招聘 的 雇主 。 毕 业 生 的 能 力 有 高 低 ， 
能 力 高 的 人 往往 也 具有 更 高 的 生产 能 力 , 为 雇主 带 来 更 多 的 价值 。 如 果 信 息 完 全 , 则 一 切 
问题 迎刃而解 ,雇主 只 需 依 照 毕业 生 的 生产 能 力 支付 工资 即 可 。 例 如 ,在 完全 竞争 市 场 
下 ,高 ,低能 力 的 应 聘 者 生产 能 力 分别 为 2、1 个 产量 单位 。 那 么 ,雇主 给 高 能 力 者 2 万 元 、 
低能 力 者 1 万 元 ; 高 、 低 能 力 的 毕业 生 分 别 得 到 2 万 元 和 1 万 元 的 工资 。 这 是 一 个 稳定 
的 均衡 。 

但 事实 上 信息 是 不 完全 的 。 一 般 来 讲 , 雇 主 可 以 通过 应 聘 者 的 衣着 、 谈 吐 等 信息 来 识 
别 毕 业 生 的 能 力 高 低 。 但 是 这 些 信号 可 能 不 够 强烈 ,不 能 有 效 分 离 两 类 应 聘 者 。 可 以 想 
象 ,一 个 人 的 受 教育 水 平 是 不 能 随便 编造 的 。 因 此 ,暂且 让 我 们 考察 教育 水 平 的 信号 作 
用 。 请 留意 , 引 语 故事 中 有 人 抱怨 "大 学 生 在 校 期 间 学 到 的 知识 实用 性 不 强 ”, 因 此 不 妨 假 
设 一 个 人 的 生产 能 力 是 既定 的 ,不 受 教育 年 限 的 影响 。 此 时 学 历 或 文凭 仅 是 传递 能 力 的 
信号 。 高 能 力 者 为 了 表明 自己 是 高 能 力 的 ,可 以 取得 高 水 平 教育 的 证 书 。 但 是 ,接受 教育 
是 有 成 本 的 ,如 入 学 考试 及 其 准备 成 本 、 入 学 后 的 学 习 成 本 等 。 对 于 给 定 的 教育 水 平 (可 
简单 理解 为 教育 年 限 )y, 假 定 低能 力 者 成 本 为 ,高 能 力 者 生产 成 本 为 y/2。 

假设 毕业 生 的 能 力 9 有 高 低 两 种 类 型 , 记 作 90€ { 瓦 , 工 )。 毕 业 生 知 道 自己 的 能 力 高 
低 ,而 雇主 不 知道 。 但 是 雇主 知道 整个 人 群 中 应 聘 者 能 力 高 低 的 分 布 , 这 是 共同 知识 。 假 
设 P{0 一 工 } 一 思 ,P{10 一 万 } 一 q。 
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分 思考 与 练习 


在 完全 信息 下 ,雇主 为 什么 会 给 高 能 力 者 2 万 元 ,低能 力 者 1 万 元 ? 分 别 少 于 2 万 元 
和 ] 万 元 岂 不 是 更 好 吗 ? 而 在 不 完全 信息 且 没 有 信号 传递 的 情况 下 ,雇主 又 该 支付 给 每 
村主 人 :多 术 ? 


博弈 的 次 序 如 下 : 首先 ,毕业 生 作为 信号 发 送 者 选择 受 教育 水 平 ; 其 次 ,雇主 观察 到 
信号 并 形成 自己 的 信念, 依据 应 聘 者 能 力 的 高 低 来 支付 工资 ; 最 后 ,毕业 生得 到 自己 的 工 
资 。 当 然 , 在 进行 海 萨 尼 转换 时 .需要 在 第 一 阶段 之 前 加 入 自然 的 选择 , 即 自然 选择 毕业 
生 的 类 型 ,概率 分 别 为 p 和 g。 

在 接触 均衡 之 前 ,让 我 们 先 讨论 雇主 的 信念 与 策略 。 假 设 雇主 相信 存在 某 一 水 平 的 
教育 y* , 当 应 聘 者 的 受 教育 水 平 > 过 y” 时 ,毕业 生 一 定 是 高 能 力 者 ; 当 > 二 y 时 ,毕业 
生 一 定 是 低能 力 者 。 如 果 雇 主持 有 这 一 信念 , 则 他 的 最 优 策 略 应 该 是 给 高 能 力 者 支付 工 
资 2 万 元 ,给 低能 力 者 支付 工资 1 万 元 一 一 由 于 市 场 是 完全 竞争 的 ,否则 可 能 招聘 不 到 
工人 。 

(1) 如 果 毕 业 生 把 教育 水 平 设 为 > 过 >y”, 则 被 雇主 认为 是 低能 力 者 。 此 时 > 一 0 是 最 
优 行动 一 一 因为 任何 大 于 0 但 不 超过 y* 的 教育 水 平 不 仅 不 能 改变 雇主 的 信念 ,反而 会 增 
加 成 本 。 换 言 之 ,如 果 一 个 毕业 生 不 愿意 表现 为 高 能 力 者 ,那么 他 干脆 不 接受 任何 教育 。 
有 点 儿 类 似 于 “ 破 镀 子 破 摔 ”。 

(2) 同 理 , 当 教育 水 平 > 之 y 时 y 二 y* 是 他 的 最 优 行动 。 

(3) 如 果 毕 业 生 依据 自己 的 类 型 诚实 行动 ,那么 低能 力 者 必定 选择 y 二 0, 高 能 力 者 
一 定 选择 y 二 y* 。 但 是 若 毕 业 生 并 不 诚实 ,而 是 采取 策略 行动 呢 ? 

如 图 5-13 所 示 ,给 定 信念 y* 。 对 于 低能 力 的 毕业 生 , 如 果 想 被 雇主 认定 为 高 学 历 以 
致 得 到 高 工资 ,必须 满足 受 教 育 年 限 不 低 于 y*。 
所 以 ,低能 力 者 选择 > 一 y” ,得 益 为 2 一 y* (图 中 


L)。 反 之 , 若 低 能 力 者 满足 于 低 工资 , 则 选择 y= 2 本 角力 的 民 相 
0, 此 时 得 益 志 最大。 显然 ,高 能 力 者 选择 y=y*， BA 
此 时 得 益 为 2 一 y* /2( 图 中 HH)。 对 于 就 业 市 场 而 1 一 
言 ,一 个 理想 的 结果 是 低能 力 者 得 到 低 工资 高能 WT 
| 受 教育 年 限 
1 .让 过 


力 者 得 到 高 工资 。 换 言 之 ,雇主 能 够 通过 信号 ( 文 0 
赁 ) 来 区 分 两 种 类 型 的 毕业 生 。 但 这 是 市 场 经 济 ， 


每 个 主体 都 有 自己 的 行为 动机 。 若 想 有 效 地 分 离 ”图 513 受 教育 水 平 的 信号 


两 种 类 型 的 毕业 生 ,必须 使 所 有 参与 者 都 愿意 ， 人 
亦 即 
sd 之 
2—y*/2>1 


这 就 是 激励 相 容 约束 。 
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因此 , 当 1 二 y* 过 2 时 该 博弈 存在 分 离 均衡 ,同时 雇主 的 信念 也 与 市 场 一 致 。 后 者 意 
味 着 : 双方 都 会 依照 雇主 的 信念 行动 ; 进一步 ,如 果 外 在 条 件 不 变 ,雇主 无 须 更 新 自己 的 
售 念 。 注 意 这 是 在 教育 不 改变 毕业 生 能 力 的 前 提 下 得 到 的 结果 。 它 表明 即使 所 学 知识 无 
用 ,只 要 条 件 得 当 , 学 历 也 能 够 成 为 筛选 应 聘 者 的 一 个 信号 。 由 此 延伸 ,大 家 可 以 思考 证 
代 科举 制度 在 人 才 选 拔 方面 的 积极 作用 。 另 请 读者 注意 ,雇主 的 信念 为 无 限 多 个 ,因此 均 
衡 也 有 无 限 多 个 。 而 且 , 当 雇主 的 信念 超出 此 范围 时 存在 合并 均衡 和 半分 离 均 衡 等 。 本 
书 不 再 深入 讨论 。 作 为 总 结 ,让 我 们 整理 一 下 该 分 离 均衡 。 

(1) 雇主 的 信念 : 存在 某 一 水 平 的 教育 1 二 y* 二 2, 当 应 聘 者 的 受 教育 水 平 y 宇 y* 
时 ,毕业 生 一 定 是 高 能 力 者 ; 当 y 二 y* 时 ,毕业 生 一 定 是 低能 力 者 。 

(2) 如 果 雇 主 认 为 毕业 生 是 高 能 力 者 , 则 支付 工资 2 万 元 ; 否则 ,支付 1 万 元 。 

(3) 如 果 毕 业 生 是 低能 力 的 , 则 选择 不 接受 教育 ; 如 果 毕 业 生 是 高 能 力 的 , 则 选择 接 
受 教育 水 平 为 y* 。 


分 思考 与 练习 


在 上 述 就 业 市 场 模 型 中 ,假定 个 人 的 生产 能 力 是 不 受 教育 水 平 影响 的 。 如 果 教 育 能 
够 改变 个 人 生产 能 力 , 博 弈 以 及 分 离 均衡 又 会 是 怎样 的 ? 


概 而 论 之 ,信号 传递 的 均衡 结果 到 底 如 何 ,主要 取决 于 双方 发 送 各 种 信号 的 成 本 。 如 
果 有 个 信号 ,一 类 劳动 者 发 送信 号 的 成 本 很 低 而 另 一 类 发 送 同样 的 信号 的 成 本 很 高 ,那么 
就 更 容易 形成 分 离 均衡 ; 如 果 双 方 发 送信 号 的 成 本 都 很 高 , 则 可 能 都 不 发 送 ; 如 果 双 方 
发 送信 号 的 成 本 很 低 ,那么 双方 都 可 能 会 积极 发 送 (因为 不 发 送 则 境况 会 更 差 ) 。 

关于 信号 传递 理论 ,还 有 一 个 著名 的 格 罗 斯 曼 (Gross Man) 分 离 定理 简要 介绍 给 读 
者 。 这 是 由 经 济 学 家 格 罗 斯 曼 提出 来 的 。 假 设 有 3 个 工人 .其 生产 能 力 分 别 为 60、80、 
100。 假 设 机 制 能 够 准确 地 依据 对 工人 能 力 的 判断 来 支付 工资 。 由 于 平均 能 力 为 80, 所 
以 能 力 为 100 的 人 有 动力 以 某 种 信号 表明 自己 是 突出 于 其 他 两 人 的 。 当 能 力 为 100 的 人 
被 分 离 出 来 之 后 , 剩 下 的 两 人 平均 能 力 由 于 为 70, 此 时 能 力 为 80 的 人 又 有 动力 将 自己 与 
能 力 为 60 的 人 区 分 开 来 ,使 别人 相信 他 不 是 能 力 为 60 的 人 。 因 此 ,如 果 具 有 隐蔽 特征 的 
代理 人 能 够 提供 有 关 隐 蔽 特征 的 信息 ,那么 所 有 隐蔽 特征 在 一 段 时 间 之 后 就 会 被 人 们 了 
解 。 这 被 称 为 格 罗 斯 曼 分 离 定 理 。 

理性 人 是 如 此 趋 利 避 害 ,一 旦 发 现 可 以 从 披露 私有 信息 中 获得 好 处 ,就 会 尽力 去 表 
达 。 而 向 对 手 披露 私有 信息 的 这 种 行为 ,就 是 信号 传递 或 者 信号 显示 。 这 种 信号 的 显示 
可 以 用 来 表现 自己 的 真实 类 型 ,从 而 改进 自身 结果 ,避免 术 榜 市 场 的 “逆向 选择 ”。 值 得 说 
明 的 是 ,信号 传递 是 信息 优势 方 先 选择 自己 的 行动 以 发 送 有 关 信 息 , 从 而 展示 自己 的 真实 
类 型 。 而 如 果 不 具 有 私有 信息 的 一 方 先 行动 ,通过 不 同 的 得 益 情况 来 让 不 同类 型 的 对 手 
有 着 不 同 的 行动 , 那 就 是 信息 甄别 了 。 

但 是 ,信号 传递 并 非 都 是 有 效 的。 在 股票 市 场 中 ,投资 者 会 根据 上 市 公司 的 业绩 以 决 
定 是 否 对 公司 进行 投资 ,而 公司 的 业绩 一 般 以 财务 报表 呈现 。 由 于 只 有 公司 高 管 会 对 公 
司 的 真实 业绩 有 所 了 解 , 外 部 投资 者 并 不 能 够 了 解 足够 的 内 部 信息 。 因 此 ,一 个 业绩 差 的 


第 5 章 不 完全 信息 博弈 209 


公司 高 管 有 足够 强 的 动机 发 布 对 公司 利好 的 财务 报表 ,以 诱骗 不 明 真 相 的 散户 投资 。 上 
市 公司 高 管 这 样 的 举动 ,扭曲 了 真实 信息 的 传递 ,使 得 投资 者 难以 相信 消息 ,进而 失望 ,不 
再 投资 市 场 。 

在 体制 健全 的 社会 中 ,欺骗 将 会 付出 代价 。 面 对 “逆向 选择 ?严重 的 股市 ,监管 当局 颁 
布 了 新 的 法 案 ,严惩 发 布 虚 假 消 息 的 上 市 公司 。 要 求 上 市 公司 每 年 都 必须 经 由 外 部 进行 
独立 审计 ,并 且 要 求 公 司 高 管 对 其 财务 报表 负责 。 这 样 一 来 ,上 市 公司 会 忌 昼 发 布 虚假 信 
息 所 要 付出 的 巨大 代价 ,进而 保证 年 报 的 真实 性 。 此 法 案 一 出 ,投资 者 都 会 选择 相信 这 些 
原本 面目 可 习 的 公司 高 管 ,市 场 的 信心 得 到 了 恢复 ,逆向 选择 得 以 解决 。 

可 见 , 只 要 有 信和 号 传递 以 及 保证 信号 为 真 的 手段 作为 担保 ,人 与 人 之 间 的 信任 就 能 建 
立 。 而 这 个 信号 传递 机 制 既 可 以 是 口头 声明 ,也 可 以 是 一 些 制约 自身 得 益 的 行动 ,如 法 律 
法 规 。 例 如 ,在 二 手 车 市 场 ,只 要 卖方 能 够 主动 向 买方 展示 车 子 的 质量 ,买方 可 能 愿意 出 
相应 的 较 高 价格 ,所 谓 的 柠檬 市 场 也 将 消失 ; 在 网 上 购物 ,只 要 店家 承诺 可 以 无 条 件 退 
货 ,消费 者 就 能 打消 顾虑 ,放心 购买 。 


2 扩展 阅读 : 信号 阻止 和 信息 甄别 


(1) 信号 阻止 。 站 在 信号 发 送 方 的 角度 ,如 果 向 别人 披露 信息 对 自己 有 好 处 ,那么 披 
露 信息 是 自然 的 ; 但 有 时 候 , 站 在 信号 接收 方 的 角度 ,接受 信号 对 自己 并 没有 好 处 ,这 时 
候 , 想 方法 阻止 接受 信号 反而 对 自己 更 加 有 利 。 

截断 联系 ,是 人 们 常用 的 一 种 阻止 接受 信号 的 手段 。1965 年 ,美国 有 一 场 监 狱 暴 动 ， 
当时 的 监狱 长 就 拒绝 聆听 犯人 的 要 求 ,直到 犯人 释放 所 挟持 的 警察 为 止 。 这 种 拒绝 聆听 ， 
避免 了 接受 犯人 的 要 挟 之 缮 ,反而 使 得 犯人 无 法 通过 威胁 来 达到 其 目的 ,也 使 其 明白 了 监 
狱 长 制止 暴动 的 决心 。 

故 作 不 知 ,也 是 阻止 信号 的 手段 。 例 如 ,有 的 公司 员工 总 喜欢 向 老板 传递 种 种 信息 : 
自己 在 业内 受到 多 少 重视 …… 而 一 旦 员工 判断 出 老板 获悉 这 些 信息 ,就 能 以 此 提出 加 薪 。 
此 时 老板 就 可 以 刻意 去 忽略 这 些 信 息 , 从 而 避免 员工 利用 这 些 信息 作为 威胁 。 

(2) 信息 甄别 ,又 称 信 息 利 选 。 它 是 没有 私人 信息 的 一 方 为 了 减弱 非 对 称 信息 对 自 
己 的 不 利 影 响 , 以 便 能 够 区 别 不 同类 型 的 交易 对 象 而 提出 的 一 种 交易 方式 ,比如 契约 、 条 
件 等 。 通 俗 地 说 ,信息 甄别 就 是 “如 何 让 别人 讲 真 话 ”的 方法 。 和 信号 传递 不 同 , 在 信息 甄 
别 中 参与 者 是 在 合同 提供 之 后 再 选择 行动 ,并 借 此 发 送 相关 信号 的 。 

古代 犹太 王国 的 所 罗 门 王 , 给 后 世 留 下 了 许多 精彩 的 传说 。 有 一 次 ,两 个 妇 人 为 了 争 
夺 一 个 寝 裸 中 的 婴儿 ,争吵 到 了 所 罗 门 王 那里 。 她 们 中 一 个 抱 着 一 个 已 经 死去 的 婴儿 , 另 
一 个 抱 着 一 个 活泼 的 孩子 。 之 所 以 争吵 ,就 是 因为 她 们 都 说 自己 是 那个 活着 婴儿 的 母亲 。 
因为 没有 结果 ,所 以 来 请 所 罗 门 王 做主 。 所 罗 门 王 稍 加 思考 后 断然 做 出 决定 :“ 把 剑 给 
我 …… 我 把 这 个 孩子 辟 成 两 半 , 你 们 两 人 一 人 一 半 吧 。” 听 到 这 话 , 那 位 抱 着 活 波 孩子 的 妇 
人 说 :“ 陛 下 ,请 你 不 要 这 么 做 。 这 孩子 不 是 我 的 ,就 把 孩子 还 给 她 吧 。 无 论 如 何 都 请 你 
不 要 伤害 这 个 孩子 。” 而 另外 一 个 女人 说 :“ 英 明 的 陛下 ,既然 她 说 这 孩子 不 是 她 的 ,就 请 
您 把 这 孩子 分 为 两 半 吧 。?” 听 罢 这 两 位 妇 人 的 诉求 ,所 罗 门 王立 即 做 出 最 终 裁决 :“ 把 孩子 
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给 请 求 不 杀 婴 儿 的 妇 人 。 她 才 是 这 孩子 的 真正 的 母亲 ,理应 归于 她 。 把 另外 一 位 同意 辟 
了 孩子 的 妇 人 拉 出 去 暴打 一 百 鞭 ,因为 她 太 不 诚实 ,心肠 也 太 歹 毒 。” 

所 罗 门 王 本 来 是 处 于 信息 劣势 的 ,他 完全 不 知道 哪 一 位 妇 人 才 是 孩子 的 亲生 母亲 。 
但 是 他 也 知道 ,真正 的 母亲 是 不 会 让 自己 的 孩子 被 辟 成 两 半 的 ,而 假装 的 母亲 则 有 可 能 对 
此 漠不关心 。 基 于 此 ,所 罗 门 王 设计 了 一 个 策略 ,要 求 " 将 孩子 一 劈 为 二 ”, 从 而 让 两 个 妇 
人 自动 做 出 不 同 的 选择 。 更 专业 一 点 儿 地 说 ,博弈 中 处 于 信息 劣势 的 一 方 设 计 一 个 博弈 
规则 ,可 以 让 不 同类 型 的 人 做 出 不 同 的 选择 。 设 计 者 可 以 通过 观察 不 同人 的 选择 而 推断 
各 自 的 真实 类 型 。 这 就 是 一 种 自我 选择 (self-selection) 。 

这 种 自我 选择 在 消费 市 场 常 表现 为 价格 歧视 ,又 称 差别 定价 。 所 谓 差别 定价 ,通常 指 
商品 或 服务 的 提供 者 在 向 不 同 的 接受 者 提供 相同 商品 或 服务 时 ,在 接受 者 之 间 实 行 不 同 
的 销售 价格 或 收费 标准 。 实 质 上 ,价格 歧视 是 不 了 解 消费 者 偏好 的 商家 (信息 淄 势 方 ) ,为 
区 分 不 同 层次 的 消费 者 而 设计 出 来 的 一 种 策略 。 优 惠 券 作为 差别 定价 策略 的 一 种 , 极 好 
地 区 分 了 愿意 付出 时 间 成 本 来 搜索 优惠 信息 的 “平民 ”和 不 在 乎 优惠 信息 而 直接 到 门店 购 
买 的 “ 富 人 ”两 类 消费 者 ,让 他 们 都 支付 了 他 们 愿意 支付 的 最 高 价格 。 注 意 ,这 里 的 “平民 ” 
和 “ 富 人 ”并 非 单纯 指 经 济 境况 ,而 是 指 消费 者 对 待 同等 商品 时 购买 意愿 的 高 低 。 

商家 定价 的 最 理想 情况 是 ,价格 在 消费 者 能 接受 的 程度 下 最 大 化 ,并 且 实 现在 这 一 价 
格 下 的 销量 最 大 化 。 换 言 之 ,商家 应 该 尽 可 能 按照 每 名 消费 者 所 愿意 支付 的 最 高 价格 进 
行销 售 。 问 题 在 于 消费 者 并 不 会 把 这 种 价格 表现 出 来 。 因 此 ,差别 定价 策略 能 够 使 得 消 
费 者 进行 “自我 选择 ”, 以 此 达到 信息 甄别 的 目的 。 

一 个 很 简单 的 方法 就 是 发 放 优惠 券 。 由 此 商家 就 可 以 把 具有 不 同 购买 意愿 的 消费 者 
区 别 开 来 (甄别 消费 者 类 型 ), 从 而 对 不 同 的 消费 者 收取 不 同 的 价格 。 假设 一 份 快餐 成 本 
10 元 ,定价 20 元 时 ,1000 人 会 接受 此 价格 ; 定价 25 元 时 ,有 600 人 会 接受 此 价格 ,前 者 
利润 为 (20 一 10)X1000 二 10 000( 元 ), 后 者 利润 为 (25 一 10)X600 二 9 000( 元 ) 。 商 家 既 
想 定价 高 一 些 , 但 又 不 愿 放弃 其 中 400 个 购买 意愿 较 低 的 消费 者 。 于 是 决定 用 5 元 优惠 
券 来 吸引 他 们 ,同时 对 剩 下 那 600 个 高 意愿 消费 者 依然 维持 25 元 的 原价 销售 。 此 时 商家 
利润 为 600X25 十 400X20 一 10X1 000= 王 13 000( 元 ) ,达到 了 最 大 化 。 


分 思考 与 练习 


为 什么 一 些 餐厅 频频 推出 促销 政策 ,声明 对 集 齐 某 几 种 星座 的 顾客 将 给 予 半价 优惠 ? 
为 什么 名 牌 产品 的 专卖 店 都 设立 在 租金 高 昂 的 中 心地 段 , 宁 愿 门 可 罗 窟 也 不 进行 降价 销售 ? 


5.6 博取 声誉 : 真实 还 是 伪装 * 


声誉 是 宝贵 的 财富 。 正 直 善 良 的 声誉 会 使 其 他 人 更 愿意 与 你 合作 ,而 朋友 反目 的 先 
例会 让 人 对 你 敬而远之 ; 有 债 必 偿 的 声誉 会 帮 你 轻松 借 到 钱 款 ,而 一 次 未 还 清 的 债务 可 
能 会 将 你 努力 维护 的 信用 毁 于 一 旦 。 墨 子 曾 说 过 ,名 不 徒 生 ,而 誉 不 自 长 , 功 成 名 遂 , 名 
誉 不 可 虚设 。 在 社会 生活 和 交往 过 程 中 ,一 个 人 会 努力 为 自己 树立 良好 的 声誉 ,而 且 越 是 


第 5 章 不 完全 信息 博弈 2 


名 人 越 加 珍惜 。 有 个 成 语 叫 “ 身 败 名 裂 ”, 很 多 时 候 人 们 很 难 分 清 , 到底 是 身 败 带 来 了 名 
裂 ,还 是 名 裂 而 招致 身 败 。 本 节 将 从 博弈 论 的 角度 讨论 声誉 问题 。 此 外 ,第 6 章 还 会 从 重 
复 博 弈 的 角度 再 谈 声誉 。 


2 扩展 阅读 :《 关 于 名 誉 》 


据 我 视野 所 及 ,古今 中 外 公认 不 名 誉 的 行为 大 臻 有 以 下 四 项 一 一 

一 、 违 背 全 人 类 的 生存 原则 ,伤害 无 境 , 其 凌 众 生 , 套 与 黑帮 ,投靠 法 西 斯 ,协助 侵略 
者 ,成 了 汉奸 或 其 他 什么 奸 ; 

二 、 和 触犯 普通 刑法 ,如 偷盗 .诈骗 .贪污 之 类 ; 

三 、 出 卖 朋友 、 背 叛 友 情 、 忘 思 负 义 一 一 这 是 在 日 常生 活 中 最 容易 发 生 , 因 此 也 最 具 
有 广泛 敏感 度 的 不 名 誉 行为 ; 

四 、 因 嫉 贤 妨 能 而 造谣 诽谤 、 制 造 事端 。 

世上 的 坏事 多 得 很 ,但 有 些 坏事 ,哪怕 是 带 有 拳脚 气 的 坏事 ,名 誉 上 的 损耗 并 不 大 ,而 
只 要 这 涉 到 以 上 四 项 ,名 誉 的 裂缝 就 难于 弥补 了 。 此 间 差 别 , 关 及 人 类 心灵 深 处 的 一 些微 
妙 颤 动 , 深 可 玩味 。 

同样 , 若 要 找 出 不 受 时 空 限制 的 名 誉 原则 ,大 致 也 只 有 以 下 三 项 而 已 一 

一 、 对 人 类 的 由 说 总 爱 和 真诚 贡献 ; 

二 、 面 对 世间 绑 恶 ,敢于 抗争 ; 

三 、 维 护 自身 和 群体 的 体面 和 尊严 。 

其 他 名 誉 ,大 多 由 这 几 项 派生 出 来 ,如 果 全 然 无 关 , 则 就 不 必 过 于 在 意 了 。 

-一 摘自 余秋雨 (关于 名 誉 。 上 篇 》 


内 徒 困境 是 我 们 最 早 接触 的 博弈 论 模型 之 一 。 它 简单 通俗 ,易于 理解 ,同时 又 非常 具 
有 典型 意义 。 此 处 将 以 办 徒 困境 为 例 讲解 信息 不 完全 时 声誉 是 如 何 建立 的 。 假 设 两 个 内 
徒 A 和 B 进行 博弈 的 策略 矩阵 如 图 5-14 所 示 。 


囚徒 B 
合作 背叛 


”合作 | 33 -1.4 
四 徒 A 攻 括 本 加 
图 5-14 困境 囚徒 博弈 的 策略 矩阵 


不 难 推 知 该 博弈 存在 唯一 均衡 : (背叛 ,背叛 )。 如 果 因 徒 困境 被 不 断 地 重复 , 身 处 其 
中 的 办 徒 会 偏离 均衡 转 而 合作 吗 ? 对 博弈 论 的 研究 发 现 ,一 般 而 言 只 要 重复 博弈 的 次 数 
是 有 限 的 ,就 不 会 使 局 中 人 选择 合作 策略 。 但 这 似乎 违反 直观 ,与 现实 中 所 观察 到 的 合作 
现象 相 矛 盾 一 一 常 有 身 处 困境 的 “囚徒 ?选择 合作 策略 。 难 道 是 前 提 预 设 出 现 了 问题 ? 现 
实 中 遇 到 的 重复 博弈 尽管 都 在 有 限 次 数 终止 ,但 在 数学 处 理 上 仍 有 “无 限 ”" 和 “有 限 ” 的 区 
别 。 这 点 将 在 第 6 章 介绍 。 事 实 上 ,即使 在 有 限 重复 博弈 中 ,合作 行为 也 是 频繁 出 现 的 ， 
特别 是 在 距 博弈 结束 仍 比 较 远 的 阶段 更 是 如 此 。Axelrod(1981,1984) 的 锦标 赛 实验 结果 
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表明 : 在 200 次 重复 内 徒 博弈 中 , 当 离 博弈 结束 比较 远 时 合作 行为 仍 会 频繁 出 现 ; 而 参与 
者 所 选取 的 策略 也 有 偏好 趋向 ,其 中 “针锋相对 "策略 是 最 稳定 的 。 

博弈 论 的 4 位 芮 基 人 克 雷 普 斯 , 米 格 罗 姆 .罗伯茨 和 威尔逊 发 现 : 之 所 以 认为 在 有 限 
重复 博弈 中 不 会 出 现 合 作 行为 ,原因 是 存在 两 个 假定 , 即 理性 人 是 共同 知识 和 信息 完全 假 
定 。 为 此 ,他 们 构造 了 一 个 著名 的 “声誉 模型 ”, 在 有 限 重复 博弈 中 引入 不 完全 信息 和 理性 
人 非 共同 知识 的 假定 ,发 现存 在 合作 型 子 博弈 精炼 均衡 解 , 从 而 解 开 了 这 个 悖 论 。 他 们 证 
明 ,信息 是 否 完全 对 均衡 结果 有 着 重要 影响 。 具 体 而 言 , 合 作 行 为 在 有 限 重复 博弈 中 有 可 
能 出 现 一 一 只 要 重复 次 数 足 够 多 ,但 不 必 是 无 限 次 数 的 。 例 如 ,“ 坏 人 ”可 能 在 相当 长 的 时 
间 里 表现 得 像 * 好 人 ”一 样 。 

不 妨 假设 囚犯 A 了解 囚犯 B 的 所 有 特征 ,但 办 犯 B 对 囚犯 A 不 其 了 解 。 在 B 的 认 
识 中 ,A 有 两 种 可 能 类 型 : 理性 的 与 非 理性 的 。 简 单 起 见 ,假设 “ 非 理 性 ”的 A 只 会 使 用 
“针锋相对 ”策略 。“ 针 锋 相对 ” 意 指 一 个 参与 者 首先 选择 合作 ,只 要 对 方 一 直 合作 ,就 与 对 
方 合作 下 去 ; 一 旦 对 方 背叛 ,就 中 止 和 对 方 的 合作 ,直到 对 方 再 主动 恢复 合作 。 该 策略 非 
常 简易 实用 , 亦 即 常 说 的 “以 眼 还 眼 , 以 牙 还 牙 ”。 而 理性 的 A 则 会 选择 对 自己 有 利 的 
策略 。 

先 从 重复 2 次 的 内 徒 困境 开始 ,再 推 及 重复 3 次 。 


5.6.1 重复 2 次 的 囚徒 困境 


假设 内 徒 困境 博弈 重复 2 次 ,自然 赋予 A 理性 的 概率 为 p, 非 理性 的 概率 为 1 一 p。 
可 能 行动 如 图 5-15 所 示 , 其 中 X 表示 待定 的 某 一 行动 。 


参与 者 第 1 阶段 第 2 阶段 


A( 理 性 的 : p) 


( 非 理 性 的 : ) 
B( 理 性 的 ) X 背叛 


图 5-15 ”信息 不 完全 时 重复 2 次 的 囚徒 困境 


由 于 B 是 理性 的 ,所 以 第 2 阶段 B 一 定 会 选择 背叛 。 如 果 A 是 理性 的 ,那么 A 也 会 
选择 背叛 。 但 是 如 果 A 是 非 理 性 的 ,那么 此 时 既 有 可 能 背叛 也 有 可 能 合作 。 它 取决 于 第 
1 阶段 B 的 行为 ,此 处 用 X 表示。 

接 下 来 分 析 第 1 阶段 。 如 果 A 是 理性 的 ,那么 他 在 第 1 阶段 也 会 选择 背叛 一 一 因为 
A 知道 B 是 理性 的 ,所 以 无 论 他 在 第 1 阶段 选择 什么 .B 在 第 2 阶段 都 会 选择 背叛 。 但 如 
果 A 是 非 理性 的 ,他 会 在 第 2 阶段 本 能 地 选择 合作 一 一 这 依赖 于 第 1 阶段 B 的 行动 。 

但 是 B 不 同 。 尽管 B 是 理性 的 ,但 是 他 不 知道 A 是 否 理性 ,所 以 在 一 开始 就 选择 背 
叛 并 不 一 定 是 最 好 的 。 很 显然 ,假如 A 是 非 理 性 的 ,那么 他 在 第 1 阶段 选择 合作 就 能 赢 
得 第 2 次 赚 便 宜 的 机 会 。 因 此 ,需要 比较 B 的 两 个 行动 所 带 来 的 得 益 , 才 能 找到 占 优 
策略 。 


第 5 章 不 完全 信息 博弈 213 


(1) 如 果 B 在 第 1 阶段 选择 背叛 ,该 阶段 他 的 得 益 是 pX0 十 4X (1 一 p) 二 4 一 4p, 而 
在 第 2 阶段 的 得 益 则 是 pX0 十 (1 一 p)X0 二 0。 因 此 ,总 的 期 望 得 益 是 4 一 4p。 简 单 起 
见 , 此 处 省 略 了 对 折 现 因子 的 考虑 。 下 同 。 

(2) 如 果 B 在 第 一 阶段 选择 合作 ,那么 该 阶段 他 的 得 益 是 户 X( 一 1) 十 3X(1 一 户 ) 一 
3 一 4p ,而 在 第 二 次 的 得 益 则 为 pX0 十 4X (1 一 p) 二 4 一 4p。 因 此 总 得 益 是 7 一 8p。 

当 7 一 8p 宇 4 一 4p 即 p 二 0.75 时 ,B 会 在 第 1 阶段 选择 合作 。 换 言 之 , 当 B 认 为 A 是 
理性 的 可 能 性 不 超过 75% 时 ,他 会 在 第 一 阶段 选择 合作 ,而 在 第 2 阶段 背叛 。 因 为 B 不 
了 解 A 的 特征 ,所 以 B 进行 策略 比较 时 所 权衡 的 是 眼前 利益 与 长 远 利益 : 背叛 得 到 眼前 
的 得 益 但 损失 未 来 的 得 益 。 这 与 完全 信息 下 的 结果 不 同 。 


5.6.2 重复 3 次 的 囚徒 困境 


接 下 来 我 们 分 析 重 复 3 次 时 的 囚徒 困境 。 与 上 述 分 析 一 样 ,在 第 3 阶段 B 一 定 会 选 
择 背 叛 来 最 大 化 自己 的 得 益 一 一 只 要 他 是 理性 的 。 

首先 分 析 A 的 行动 。 如 果 A 是 非 理 性 的 ,那么 在 第 1 阶段 他 仍 会 选择 合作 以 期 得 到 
友好 回应 。 在 第 2 一 3 阶段 ,A 采取 “针锋相对 ”策略 ,分 别 取 决 于 B 在 第 1~2 阶段 的 选 
择 。 分 别 用 *X”Y ”标记 B 在 第 2、3 阶段 的 行动 。 另 外 ,如 果 A 是 理性 的 ,那么 在 第 2、3 
阶段 他 一 定 会 选择 背叛 ,这 与 前 面 的 两 阶段 博弈 一 样 。 但 是 ,并 不 能 惯性 推 及 A 在 第 1 
阶段 也 选择 背叛 。 为 什么 呢 ? 因为 在 第 1 阶段 A 的 背叛 会 立即 暴露 他 的 类 型 ( 意 即 他 是 
理性 的 ) ,反而 招致 B 在 第 2 阶段 的 背叛 。 即 便 如 此 , 仍 不 能 判定 A 应 选择 合作 。 和 暂 以 
“3” 记 之 。 各 方 的 行动 如 表 5-13 所 示 。 


表 5-13 重复 3 次 的 囚徒 困境 
参 与 者 第 1 阶段 第 2 阶段 第 3 阶段 
A( 理 性 的 : p) ? 背叛 背叛 
( 非 理 性 的 : 1 一 p) 合作 X ¥ 
B( 理 性 的 ) X Y 背叛 


给 定 B 在 第 1 阶段 选择 合作 。 对 于 理性 的 A 而 言 , 又 有 两 种 情况 。 

如 果 A 在 一 开始 就 背叛 了 ,那么 到 第 2 阶段 B 就 知道 A 是 理性 的 (因为 非 理 性 的 A 
不 会 首先 背叛 ) ,B 会 在 第 2 一 3 阶段 都 选择 背叛 。 此 时 A 的 总 期 望 得 益 为 4 十 0 十 0 二 4。 

如 果 A 在 第 1 阶段 选择 合作 来 隐瞒 自己 的 类 型 .那么 BB 在 第 2 阶段 仍 不 能 辨别 A 的 
类 型 。 所 以 , 自 第 2 阶段 之 后 的 子 博弈 等 同 于 重复 2 次 的 囚徒 困境 。 此 时 ,B 在 第 2 阶段 
仍 选 合 作 ( 前 提 仍 旧 为 )p 三 0.75。 换 言 之 ,只 要 B 判 断 A 是 非 理 性 的 可 能 性 高 于 25%， 
那么 他 在 第 2 阶段 仍然 选择 合作 。 所 以 ,A 在 3 个 阶段 中 行动 的 总 得 益 就 是 3 十 4 十 0 一 
7 二 4。 因 此 ,对 于 理性 的 A 而 言 .只 要 B 不 在 前 两 个 阶段 内 背叛 ,A 在 第 1 阶段 选择 合作 
总 是 最 优 的 。 至 此 ,图 5-16 中 的 “?” 变 更 为 “合作 ”。 

其 次 分 析 B 的 行动 。B 有 4 种 行动 组 合 : (合作 .合作 ,背叛 ), (合作, 背叛 ,背叛 )， 
(背叛 ,背叛 ,背叛 ), (背叛 ,合作 ,背叛 )。 将 4 种 情况 单独 列表 分 析 ( 表 5-1) 。 
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情况 1: (合作 ,合作 ,背叛 ) 


参 与 者 第 1 阶段 第 2 阶段 第 3 阶段 
A( 理 性 的 : p) 合作 背叛 背叛 
( 非 理 性 的 : 1 一 p) 合作 合作 合作 
B( 理 性 的 ) 合作 合作 背叛 


如 前 分 析 , 若 A 是 理性 的 而 且 B 在 前 两 阶段 内 没有 背叛 ,那么 A 在 第 1 阶段 选择 合 
作 总 是 占 优 的 。 若 A 是 非 理 性 的 , 则 他 3 次 都 会 选择 合作 。 此 时 ,B 的 总 期 望 得 益 是 pX 
(3 一 1 十 0) 十 (1 一 p)X(3 十 3 十 4) = 二 10 一 8p。 


情况 2: (合作 ,背叛 ,背叛 ) 


参 与 者 第 1 阶段 第 2 阶段 第 3 阶段 
A( 理 性 的 : p) 合作 背叛 背叛 
( 非 理 性 的 : 1 一 p) 合作 合作 背叛 
B( 理 性 的 ) 合作 背叛 背叛 


同上 分 析 ,B 的 总 期 望 得 益 为 pX(3 十 0 十 0) 十 (1 一 p)X (3 十 4 十 0)==7 一 4p。 
情况 3: (背叛 ,背叛 ,背叛 ) 


参 与 者 第 1 阶段 第 2 阶段 第 3 阶段 
A( 理 性 的 : p) 合作 背叛 背叛 
( 非 理 性 的 : 1 一 p) 合作 背叛 背叛 
B( 理 性 的 ) 背叛 背叛 背叛 


同 理 ,B 的 总 期 望 得 益 为 pX (4 十 0 十 0) 十 (1 一 p)X(4 十 0 十 0) 二 4。 
情况 4: (背叛 ,合作 ,背叛 ) 


参与 者 第 1 阶段 第 2 阶段 第 3 阶段 
A( 理 性 的 : p) 合作 背叛 背叛 
( 非 理 性 的 : 1 一 p) 合作 背叛 合作 
B( 理 性 的 ) 背叛 合作 背叛 


同 理 ,B 的 总 期 望 得 益 为 pX(4 一 1 十 0) 十 (1 一 p)X(4 一 1 十 4)=7 一 4p。 

将 4 种 期 望 得 益 表 示 在 同一 个 图 上 (图 5-16) ,可 以 得 到 非常 直观 的 结果 。 在 图 5-16 
中 , 横 坐 标 表示 A 理性 的 概率 , 纵 坐标 表示 B 的 预期 得 益 。 

从 图 5-16 中 得 出 , 当 p 委 0. 75 时 ,选择 (合作 ,合作 ,背叛 ) 的 得 益 最 大 。 因 此 ,只 要 
p 三 0.75, 这 样 的 策略 组 合 是 一 个 均衡 : 理性 型 A 在 第 1 阶段 选择 合作 ,第 2 阶段 和 第 3 
阶段 选择 背叛 ; B 在 第 1、2 阶段 选择 合作 ,但 在 第 3 阶段 选择 背叛 。 与 上 一 节 的 信号 传 
递 不 同 , 此 处 的 私有 信息 拥有 者 尽量 回避 有 关 自 己 类 型 的 信号 传递 。 理 性 的 背叛 者 仍然 
表现 出 合作 行为 ,使 得 自己 与 非 理 性 的 合作 者 混同 起 来 。 因 此 ,从 信息 私有 者 的 角度 讲 ， 
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0.75 


0 入 更 必 的 概 第 
图 5-16 4 种 不 同 策略 下 也 的 得 益 曲 线 


分 离 均衡 并 不 总 是 受 欢迎 的 一 一 总 有 一 部 分 人 更 喜欢 混同 均衡 。 

为 什么 不 完全 信息 下 会 出 现 这 样 的 博弈 结果 呢 ? 不 难 想象 ,坏人 可 能 在 相当 长 的 时 
间 里 表现 得 像 好 人 一 样 。 就 像 大 灰 狼 扮 成 外 婆 是 为 了 更 好 地 蒙 驴 小红帽, 声誉 机 制 就 是 
这 样 的 一 个 完美 伪装 。 当 信息 不 完全 时 ,参与 者 都 有 动机 树立 一 个 良好 的 声誉 ,从 而 在 未 
来 获得 长 期 的 得 益 。 一 般 来 讲 ,合作 的 得 益 越 大 ,双方 便 越 有 动力 来 树立 一 个 良好 的 声 
誉 。 因 此 ,只 要 重复 次 数 足 够 多 ,合作 行为 就 会 在 有 限 重 复 博 弈 中 出 现 。 

显然 ,一 个 行为 主体 的 声誉 在 长 期 内 是 与 他 人 的 互动 行为 密 不 可 分 的 。 而 声誉 的 本 
质 则 在 于 可 以 使 行为 人 获得 长 期 的 得 益 。 当 一 个 人 的 行为 特征 或 行为 类 型 不 被 他 人 所 知 
晓 , 且 在 他 们 之 间 存在 着 重复 互动 时 ,具有 信息 优势 的 一 方 就 有 动机 建立 一 个 “好 "声誉 以 
换取 长 期 利益 ,从 而 避免 那些 短期 的 .甚至 是 一 次 性 的 得 益 。 表 5-14 给 出 了 关于 声誉 起 
重要 作用 时 的 部 分 重复 博弈 的 应 用 及 其 博弈 信息 。 

表 5-14 ”声誉 起 重要 作用 时 的 部 分 重复 博弈 的 应 用 及 其 博弈 信息 


位 弈 应 用 单 边 /双边 参 与 者 行动 策略 
困境 囚徒 双边 和 5 
企 - 高 
双 赛 头 垄 断 双边 二 直人 
产品 质量 单 边 和 WE 
立 者 个， 高 
进入 威胁 a ee a 


注 : 在 某 些 博弈 中 ,每 个 博弈 中 的 策略 组 合 都 相同 ,博弈 者 之 间 的 支付 或 得 益 对 称 ， 
这 种 博弈 称 之 为 双边 博弈 。 而 另 一 种 与 双边 博弈 很 相似 ,但 这 类 博弈 并 不 对 称 , 这 就 是 单 
边 博 弈 。 例 如 ,常见 的 单 边 博弈 有 市 场 进入 博弈 、 产 品质 量 博弈 、 借 贷 博 弈 等 。 
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a 读 : KMRW 声誉 模型 
WW 进 阶 阅 读 声誉 模型 


克 雷 普 斯 、 米 尔格 罗 姆 、 罗 伯 蒋 和 威尔逊 4 人 的 思想 后 来 被 总 结 为 KMRW 声誉 模 
型 ,也 称 为 KMRW 定理 。 它 的 主要 内 容 是 这 样 的 : 尽管 每 一 个 参与 者 在 选择 合作 时 可 
能 面临 着 被 对 手 出 卖 的 风险 (从 而 可 能 得 到 一 个 较 低 的 当前 得 益 ), 但 是 如 果 他 在 面 对 一 
个 合作 型 对 手 时 选择 不 合作 ,就 暴露 了 自己 是 非 合作 型 的 ,从 而 失去 了 获得 长 期 合作 得 益 
的 机 会 。 只 要 博弈 重复 的 次 数 足 够 多 ,未 来 得 益 的 损失 就 超过 了 短期 被 出 卖 的 损失 。 因 
此 ,即使 非 合作 类 型 的 参与 者 也 都 想 在 初始 时 树立 良好 形象 (使 对 方 认为 自己 是 喜欢 合作 
的 )。 而 只 有 在 博弈 快 结 束 时 ,参与 者 一 次 性 把 自己 过 去 所 建立 的 良好 声誉 用 尽 , 合 作 才 
会 停止 (因为 此 时 的 短期 得 益 很 大 而 未 来 损失 很 小 )。 该 模型 具有 出 色 的 解释 力 。 其 主要 
原因 在 于 : 大 量 事实 表明 ,大 多 数 合 作 的 发 生 都 是 基于 对 自身 利益 的 考虑 ,而 非 对 参与 者 
合作 偏好 所 做 的 假定 。 在 一 些 长 期 交易 关系 中 ,交易 各 方 出 于 对 未 来 得 益 的 考虑 ,都 会 臻 
力 于 树立 形象 和 维护 声誉 。 虽 然 这 些 声誉 在 短期 来 看 并 非 是 经 济 的 ,但 是 合作 收入 流 的 
长 期 补偿 表明 建立 良好 声誉 是 最 优选 择 。 而 且 , 良 好 的 声誉 价值 是 随 着 它 被 使 用 的 次 数 
而 增加 的 。 可 以 说 ,KMRW 声誉 模型 对 于 认识 企业 的 本 质 提供 了 强 有 力 的 分 析 方法 和 
解释 工具 。 


5.6.3 声誉 信念 的 更 新 


实际 上 ,无 论 是 个 人 、 企 业 还 是 国家 ,声誉 都 是 一 个 宝贵 的 财富 。 然 而 怎样 才能 树立 
一 个 良好 的 声誉 呢 ? 这 是 一 个 不 断 积累 的 过 程 , 一 个 借助 良好 的 言行 给 自己 不 断 加 分 的 
过 程 。“ 始 吾 于 人 也 , 听 其 言 而 信 其 行 : 今 在 于 人 也 , 听 其 言 而 观 其 行 ." 和 孔子 的 话 恰好 也 
反映 了 人 们 对 他 人 声誉 认识 的 过 程 。 对 一 个 人 声誉 的 形成 ,不 仅 需要 听 他 怎么 说 ,更 要 看 
他 怎么 做 。 一 般 来 说 ,人 们 先是 对 某 人 的 品 性 有 个 先 验 判断 ,然后 随 着 不 断 了 解 , 通 过 他 
的 行为 来 不 断 修正 自己 的 判断 。 贝 叶 斯 法 则 已 经 在 前 文中 提 及 ,在 此 处 解释 声誉 的 积累 
时 仍然 适用 。 

简单 起 见 ,假定 办 徒 有 “义气 "和 “自私 "之 分 ,每 个 人 有 "合作 ”或 背叛 ”两 种 选择 。 当 
然 ,两 类 人 群 选择 合作 或 背叛 的 概率 是 不 一 样 的 。 假 设 义 气 的 人 选择 合作 的 概率 为 0.8， 
而 自私 的 人 则 为 0.4。 而 两 类 人 和 群 背叛 的 概率 则 分 别 为 0.2 和 0.6。 那 么 ,对 于 给 定 一 
人 ,人 们 如 何 判断 他 的 性 格 呢 ? 

假定 A 初始 认为 了 义气 的 概率 为 0. 5( 先 验 概率 为 50%) ,那么 ,A 在 看 到 B 合作 后 
而 推断 B 义 气 的 概率 是 一 个 条 件 概率 ,满足 贝 叶 斯 法 则 。 具 体 而 言 ,A 认为 B 义 气 的 概 
率 为 


接 下 来 ,如 果 B 又 做 了 一 件 合作 的 事 ,那么 A 认为 也 义气 的 概率 就 更 新 为 


0.8 X0.67 


= 0 8X0.67+0.4X0.33~ 80 


pt 


第 5 章 不 完全 信息 博弈 217 


接着 ,B 又 做 了 一 件 背 叛 的 事 , 则 A 认为 BB 义气 的 概率 一 下 子 降 为 
0.8X0.2 
PT 08x0.2+0.2X0.6 


这 便 是 声誉 的 积累 , 亦 即 A 对 B 义气 的 信念 的 更 新 。 至 此 ,也 许 有 读者 会 问 : 在 模 
型 中 B 的 声誉 到 底 是 什么 ? 没 错 ,就 是 他 人 推断 自己 义气 的 条 件 概 率 , 亦 即 行动 (合作 或 
背叛 ) 之 后 别人 对 自己 义气 或 自私 的 判断 。 

之 所 以 有 A 对 B 的 信念 的 不 断 更 新 ,是 因为 义气 的 人 与 自私 的 人 做 同一 件 事 的 可 能 
性 不 同 。 反 之 ,如 果 两 者 都 有 同样 的 可 能 性 选择 合作 ,那么 ,无 论 B 做 了 多 少 次 合作 的 事 
也 不 能 改变 A 对 他 的 信念 。 相 反 , 如 果 有 这 么 一 件 事 , 只 有 义气 的 人 会 做 ,自私 的 人 绝对 
没有 动机 去 做 (或 者 说 绝 不 愿 承担 这 么 做 的 后 果 ) ,那么 A 认为 B 一 定 是 义气 的 一 一 只 要 
B 做 了 此 事 。 

这 有 点 儿 类 似 于 好 人 和 好 事 儿 。 做 一 件 好 事 并 不 意味 着 该 人 是 好 人 ,因为 坏人 也 有 
可 能 做 好 事 来 伪装 成 好 人 。 但 是 ,正如 毛泽东 所 言 ,“ 一 个 人 做 点 好 事 并 不 难 , 难 的 是 一 非 
子 做 好 事 ,不 做 坏事 "。 因 此 ,好 事 不 一 定 传递 信息 。 但 是 ,坏事 常常 都 是 传递 信息 的 , 因 
为 好 人 轻易 不 做 坏事 ,但 也 不 会 常 做 坏事 自 毁 声誉 。 这 与 “好 事 不 出 门 , 恶 事 行 千里 ”有 异 
曲 同 工 之 妙 。 而 第 6 章 的 重复 博弈 还 将 说 明 所 有 的 善 恶 并 非 立 即 就 报 “ 人 为 善 , 福 虽 未 
至 , 祸 已 远离 ; 人 为 恶 , 祸 虽 未 至 , 福 已 远离 ”。 
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入 狱 的 “兄弟 ”并 不 总 是 陷入 “囚徒 困境 ”, 反 而 常 有 拒绝 招供 的 事情 发 生 。 假 以 时 日 ， 
“兄弟 ”又 将 出 狱 相聚 。 是 囚徒 困境 的 模型 不 适用 ? 还 是 对 出 狱 共 事 的 期 待 改 变 了 均衡 ? 
相信 本 章 内 容 将 有 助 于 读者 理解 此 类 现象 。 

本 章 将 讨论 重复 博弈 。 顾 名 思 义 ,重复 博弈 是 指 同样 结构 的 博弈 重复 很 多 次 ,其 中 的 
每 次 博弈 称 为 “阶段 博弈 ?。 通 常情 况 下 ,重复 博弈 属于 动态 博弈 的 范畴 ,可 分 为 有 限 次 重 
复 博 弈 和 无 限 次 重复 博弈 。 但 它 的 特殊 结构 使 其 具有 某 些 独特 性 质 。 在 重复 博弈 中 , 虽 
然 每 次 博弈 的 内 容 、 条 件 都 是 相同 的 ,但 是 长 期 利益 的 存在 使 得 参与 者 要 考虑 现 阶段 博弈 
所 带 来 的 后 续 反应 , 即 当前 如 何 行动 才 不 至 于 引起 对 手 在 后 阶段 的 对 抗 . 报 复 或 恶性 竞争 
(在 一 次 性 博弈 中 , 则 无 须 考虑 这 个 问题 )? 此 时 ,参与 人 可 能 会 为 了 长 远 利益 而 牺牲 眼前 
利益 ,从 而 选择 不 同 的 均衡 策略 。 因 此 ,重复 博弈 的 次 数 将 会 影响 博弈 均衡 的 结果 。 同 
时 ,信息 的 完备 性 同样 也 是 影响 重复 博弈 均衡 的 主要 因素 。 若 一 方 发 出 一 种 合作 的 信号 ， 
可 能 使 其 他 参与 者 也 采取 合作 ,从 而 实现 共同 的 长 期 利益 。 而 在 现实 经 济 生活 和 社会 活 
动 中 ,参与 者 通常 会 建立 某 种 长 期 关系 。 例 如 ,市 场 营销 中 的 回头 客 , 面 向 同 质 市 场 的 两 
家 竞争 企业 ,等 等 。 此 时 声誉 等 社会 因素 将 产生 作用 ,这 也 正 是 我 们 需要 讨论 重复 博弈 问 
题 的 根本 理由 。 


无 论 在 职场 中 还 是 在 生活 中 ,我们 处 处 都 在 权衡 ,都 在 博弈 。 但 有 时 会 选择 稳 准 狠 ， 
为 一 次 取胜 不 择 手 段 ; 有 时 却 瞻 前 顾 后 ,给 出 圆 融 的 解决 方案 。 这 样 不 同 的 选择 ,是 出 于 
什么 原因 呢 ? 我 们 来 看 下 面 的 例子 。 
在 一 个 由 两 个 厂商 寡头 你 断 竞争 市 场 的 降价 博弈 中 ,如 图 6-1 所 示 , 如 果 双 寡头 都 采 
用 高 价 销售 的 策略 ,每 个 参与 人 都 会 得 200 个 单位 的 厂商 2 
收益 ; 如 果 两 个 厂商 都 采取 降价 促销 的 策略 ,每 个 厂 
商 的 收益 都 将 降低 100。 但 是 如 果 只 有 一 家 采取 降价 
促销 ,而 另 一 家 坚持 高 价 销售 ,那么 降价 一 方 的 厂商 收 
益 将 猛 增 至 300 ,而 高 价 的 一 方 厂商 收益 将 下 滑 到 50。 
我 们 很 容易 得 到 降价 竞争 博弈 的 唯一 均衡 是 ( 降 图 6-1 寒 头 化 断 竞争 市 场 
价 , 降 价 ) 。 因 此 对 于 一 次 性 的 博弈 ,两 个 厂商 都 必 将 的 降价 博弈 
采用 降价 策略 ,各 自 收益 100, 这 显然 是 对 两 个 厂商 都 
不 理想 的 收益 。 如 果 两 个 厂商 不 打 价格 战 ,形成 合作 共 赢 局 面 , 两 个 厂商 的 收益 都 可 以 达 
到 200 ,遗憾 的 是 , (高价 高价) 不 是 博弈 的 纳什 均衡 ,而 降价 是 博弈 唯一 的 完美 纳什 均 
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衡 。 这 个 分 析 虽 然 思路 清晰 ,结论 合理 ,但 与 人 们 的 直觉 经 验 有 很 大 的 差距 ,而 且 与 经 济 
学 中 奔 头 垄 断 价格 的 理论 相悖 。 

这 是 因为 上 面 考 虑 的 是 一 次 性 的 博弈 ,但 两 个 三 商 在 同一 个 市 场 中 会 共同 生存 相当 
长 一 段 时 间 ,这 个 时 间 有 可 能 是 10 年 .20 年 ,也 有 可 能 更 长 ,这 相当 于 在 这 个 市 场 中 ,两 
个 失 头 厂商 将 进行 重复 博弈 10 次 .20 次 ,甚至 无 限 次 。 

正如 火车 站 的 小 摊贩 往往 坑 蒙 拐骗 , 质 次 价 高 ,因为 他 们 面 对 的 顾客 都 是 一 次 性 的 ， 
很 少 有 回头 客 ,索性 通过 获得 最 大 利润 。 而 社区 内 成 功 的 连锁 店 普遍 注重 产品 质量 和 合 
理 的 利润 ,因为 它 更 看 重 声誉 和 经 营 的 持久 性 。 小 摊贩 与 连锁 店 的 选择 截然 相反 ,但 他 们 
选择 的 都 是 可 选 范围 内 的 最 佳 方案 。 不 难 发 现 ,造成 这 种 结果 的 关键 因素 在 于 : 小 摊贩 
与 顾客 可 能 只 有 一 次 相遇 ,而 连锁 店 与 顾客 可 能 存在 多 次 交易 。 

明确 博弈 究竟 是 一 次 博弈 还 是 多 次 重复 博弈 ,是 很 重要 的 ,因为 两 者 的 最 优 策略 可 能 
会 发 生 改 变 : 一 次 性 博弈 无 须 考虑 行动 的 后 继 结果 ,可 以 唯利是图 ; 多 次 重复 博弈 会 建 
立 起 一 系列 的 奖惩 机 制 , 唯 有 更 遵守 道德 规范 ,才能 获得 稳定 收益 。 

那么 与 前 几 章 的 博弈 相 比 ,重复 博弈 究竟 有 何不 同 之 处 ,让 我 们 通过 本 章 一 探究 竟 。 


6.1 重复 博弈 及 其 特点 


6.1.1 什么 是 重复 博弈 


重复 博弈 是 一 种 特殊 的 动态 博弈 , 指 同样 结构 的 博弈 重复 多 次 。 它 包括 无 限 次 重复 
博弈 和 有 限 次 重复 博弈 。 虽 然 重复 博弈 是 一 次 性 博弈 的 重复 进行 ,但 重复 博 穿 的 均衡 结 
果 并 非 一 次 性 博弈 结果 的 简单 琶 加 。 

当 我 们 用 "重复 博弈 ?去 观察 生活 时 ,会 发 现 人 们 的 很 多 行为 都 可 以 得 到 解释 。 我 们 
常 看 到 陌生 人 之 间 只 因 踩 一 脚 而 发 生 口 角 甚 至 挥 拳 相向 。 在 公共 汽车 `. 地 铁 上 ,两 个 陌生 
人 为 一 个 座位 而 争吵 更 是 家 常 便 饭 。 因 为 彼此 相信 这 是 一 次 性 博弈 , 事 过 之 后 两 不 相 见 ， 
故 互 不 相让 。 但 发 生 摩擦 的 如 果 是 经 常见 面 的 熟人 ,即使 脾气 不 好 的 人 也 会 相互 谦让 。 
这 是 因为 大 家 抬头 不 见 低 头 见 , 其 间 的 博弈 是 长 久 的 “重复 博弈 ?。 在 小 县 城 小 乡村 , 犯 
罪 率 一 般 较 低 ,也 是 因为 大 家 相互 极为 熟知 ,每 日 间 低头 不 见 抬头 见 。 而 在 繁华 的 都 市 ， 
人 们 则 相对 陌生 。 如 果 法 制 不 健全 ,犯罪 率 反 而 有 可 能 会 提高 。 可 见 , 生 活 中 处 处 都 存在 
重复 博弈 的 影子 。 

像 前 述 的 例子 (图 6-1) 一 样 ,重复 博 穿 由 很 多 阶段 组 成 ,每 个 阶段 都 是 一 个 构造 相同 
的 博弈 。 但 是 ,两 个 厂商 的 策略 选择 和 收益 却 不 一 定 是 单 次 博弈 的 简单 重复 。 在 两 阶段 
重复 博弈 中 ,厂商 的 总 收益 可 视 为 两 个 阶段 单 次 博弈 收益 的 简单 到 加 (图 6-2)。 但 是 对 
于 无 限 次 重复 博弈 ,其 总 收益 就 不 仅仅 是 所 有 阶段 收益 的 简单 释 加 ,下 文 将 详细 介绍 。 在 
重复 博弈 中 ,与 单 次 博弈 不 同 的 是 参与 人 不 仅 要 关心 自己 当前 的 利益 ,还 要 着 眼 于 自己 的 
长 远 利益 。 因 此 博弈 中 的 参与 人 对 未 来 收益 的 判断 会 影响 当前 阶段 的 行动 选择 。 虽 然 是 
简单 博弈 的 多 阶段 重复 ,但 是 因为 参与 人 要 考虑 自己 的 长 远 利益 ,这 样 报复 、 制 裁 等 威胁 
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都 将 成 为 很 现实 的 制约 手段 ,而 声誉 、 公 平等 信念 也 成 为 可 信和 的 激励 因素 。 俗 话说 的 “ 善 
有 善 报 , 恶 有 恶 报 ” 可 能 成 为 博弈 局 势 中 的 参与 人 所 必须 面 对 的 现实 。 
厂商 2 
高 价 -高 价 “高价 -降价 ”降价 -高 价 ”降价 -降价 
高 价 -高 价 | 400,400 | 250,500 | 250,500 | 100,600 
厂 高价 降价 | 5 300,300 | 350,350 | 150,400 


降价 -降价 600. 100 | 400,150 | 400.150 | 200,200 


图 6-2 ”两 次 重复 寡头 垄断 竞争 市 场 的 降价 博弈 


在 单 次 博弈 中 ,参与 人 间 缺 乏 相互 制约 的 手段 ,也 无 法 通过 制裁 和 威胁 来 实现 参与 人 
之 间 行 为 的 相互 约束 。 因 此 一 次 博弈 很 难 形成 有 效 配合 和 默契 ,从 而 导致 有 些 博弈 的 收 
益 不 是 帕 累 托 最 优 结 果 , 比 如 “办 徒 困境 ”"。 因 此 在 单 次 博弈 中 ,参与 人 之 间 的 相互 不 信任 
甚至 是 欺骗 ,到 了 重复 博弈 中 可 能 走向 相互 配合 和 协作 ,以 至 于 追求 双方 的 共同 利益 。 于 
是 参与 人 之 间 互 惠 互 利 、 合 作 共 赢 的 机 会 要 比 单 次 博弈 中 大 得 多 。 与 第 3 章 描 述 的 动态 博 
弈 不 同 ,重复 博弈 中 ,各 阶段 并 非 紧 密 衔 接 . 环 环 相 扣 , 而 是 相对 独立 ` 没 有 实质 性 的 联系 。 
重复 博弈 中 所 有 的 参与 人 都 能 够 观察 到 过 去 的 历史 , 即 在 以 往 的 各 阶段 中 各 参与 人 所 实施 
的 行动 轨迹 。 而 参与 人 的 收益 则 是 各 阶段 收益 之 和 。 此 处 的 “和 "是 广义 的 , 指 各 阶段 博 穿 
中 参与 人 收益 的 折 现 值 之 和 ,或 者 平均 加 权 值 ,这 一 点 对 于 无 限 次 重复 博弈 尤为 重要 。 

在 重复 博弈 中 ,有 两 个 主要 因素 会 影响 重复 博弈 的 结果 : 一 是 博弈 的 重复 次 数 ,这 将 
决定 参与 人 对 短期 利益 与 长 远 利益 的 权衡 。 博 弈 的 过 程 不 仅 是 参与 人 行动 的 过 程 ,而 且 
也 是 参与 人 不 断 修正 信念 的 过 程 。 重 复 博 弈 的 次 数 越 多 ,所 获得 的 相关 信息 就 越 多 ,进而 
原 有 的 先 验 信息 被 修正 ,信息 不 对 称 被 弱化 ,有 利于 形成 长 远 预 期 。 二 是 重复 博弈 中 信息 
的 完备 性 ,这 是 重复 博弈 能 够 产生 约束 效力 的 基础 所 在 。 一 旦 信息 不 完整 ,参与 者 的 惩罚 
与 奖赏 策略 将 无 的 放 矢 ,重复 博弈 的 约束 机 制 荡然 无 存 。 此 时 何 谈 互 利 互惠 ?在 本 章 接 
下 来 的 部 分 ,读者 将 会 逐步 认识 到 无 限 次 重复 与 有 限 次 重复 ,完全 信息 与 不 完全 信息 之 间 
的 重要 区 别 。 


6.1.2 重复 博弈 的 特点 


至 此 ,你 应 该 对 重复 博弈 建立 了 初始 的 理解 。 重 复 博弈 是 一 种 最 简单 的 可 观察 行动 
的 多 阶段 博弈 ,是 相同 结构 的 博弈 重复 进行 多 次 ,其 中 可 重复 的 最 小 单元 又 称 为 阶段 博 
弈 。 这 种 相同 结构 的 博弈 可 以 重复 多 次 甚至 是 无 限 次 。 另 外 ,阶段 博弈 既 有 可 能 是 静态 
的 ,也 可 能 是 动态 的 。 但 是 ,整个 重复 博弈 的 确 是 一 个 动态 的 博弈 过 程 一 一 只 是 这 个 动态 
博弈 与 静态 博弈 也 有 关联 。 总 体 来 说 ,重复 博弈 是 一 类 常见 的 、 特 殊 的 而 且 非 常 重要 的 动 
态 博弈 。 它 具有 如 下 特点 。 

(1) 重复 博弈 是 一 种 特殊 的 扩展 型 博弈 和 可 观察 行动 的 多 阶段 博弈 。 重 复 博 讲 的 每 
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一 个 阶段 都 能 单独 构成 一 个 完整 的 博弈 ,博弈 的 各 阶段 之 间 没有 利益 上 的 联系 ,而 且 前 阶 
段 的 博弈 不 改变 后 阶段 的 博弈 结构 。 因 此 ,博弈 中 的 参与 人 不 是 一 次 性 选择 策略 ,而 是 分 
阶段 有 次 序 的 动态 选择 。 在 扩展 型 博弈 中 ,参与 人 的 行动 选择 是 面向 整个 局 势 的 ; 而 在 
重复 博弈 中 则 是 基于 上 一 阶段 的 结果 ,在 每 一 次 原 博弈 G 的 重复 中 选择 行动 。 

(2) 重复 博弈 的 每 一 阶段 ,各 参与 者 的 可 能 策略 .行动 规则 以 及 收益 函数 等 都 是 相同 
的 。 在 重复 博弈 G 中 ,每 个 阶段 都 是 原 博 弈 G 的 一 次 重复 。 因 而 在 G' 的 每 个 阶段 中 ,所 
有 参与 人 及 其 策略 集 是 固定 不 变 的 ,而 且 参 与 人 行动 的 先后 次 序 和 阶段 博弈 的 收益 函数 
也 都 是 固定 不 变 的 ,这 是 重复 博弈 和 一 般 动态 博弈 的 重要 区 别 。 

(3) 重复 博弈 的 每 一 阶段 既 可 以 是 动态 扩展 型 博弈 ,也 可 以 是 静态 策略 型 博弈 ,但 大 
多 数 情况 都 是 策略 型 博弈 。 这 是 由 于 相对 于 整个 博弈 的 延续 时 期 来 说 ,在 博弈 的 一 个 阶 
段 中 ,各 参与 人 行动 时 间 及 先后 次 序 几 乎 可 以 忽略 不 计 。 

(4) 在 重复 博弈 中 ,全 部 参与 人 都 能 观察 到 历史 信息 一 博弈 的 行动 选择 轨迹 , 即 各 
参与 人 所 做 的 行为 选择 和 收益 都 能 被 观察 到 。 唯 有 如 此 ,才能 在 动态 博弈 中 通过 承诺 或 
可 置信 威胁 来 强化 参与 者 之 间 的 关系 ,从 而 获得 合作 的 可 能 。 通 过 重复 博弈 而 建立 起 的 
约束 机 制 ,特定 的 策略 选择 也 有 助 于 从 冲突 到 合作 的 转化 。 

(5) 虽然 在 重复 博弈 中 各 个 阶段 的 策略 空间 行动 规则 及 收益 都 是 一 样 的 ,但 是 重复 
博弈 达到 的 均衡 仍然 存在 帕 累 托 改 进 。 因 为 参与 人 之 间 存 在 长 期 利益 关系 ,所 以 各 参与 
人 在 实施 行动 时 必须 考虑 后 继 阶 段 的 对 抗 .报复 与 竞争 。 具 体 来 讲 , 参 与 人 为 了 获得 自己 
的 长 期 利益 而 可 能 进行 某 种 形式 的 合作 ,从 而 相互 妥协 。 因 此 ,重复 博弈 相 较 于 一 次 性 博 
弈 可 以 获得 更 高 效率 的 均衡 。 

(6) 重复 博弈 是 多 阶段 的 动态 博弈 , 子 博 弈 的 概念 同样 适用 , 即 子 博弈 的 完美 纳什 均 
衡 概念 和 道 向 归纳 法 等 都 可 以 在 重复 博弈 中 得 以 应 用 。 

(7) 在 重复 博弈 中 ,各 参与 人 的 总 收益 是 各 阶段 博弈 收益 的 折 现 之 和 或 加 权 平均 。 
重复 博弈 的 每 一 个 阶段 就 是 一 个 完整 的 博弈 G。 在 博弈 G 中 参与 人 都 会 有 各 自 的 收益 ， 
而 重复 博弈 G 的 总 收益 就 是 阶段 博弈 G 按 折 现 因子 加 权 的 各 阶段 收益 之 和 。 稍 有 不 同 
的 是 ,在 扩展 型 博弈 的 每 个 阶段 ,参与 人 在 各 个 阶段 选择 自己 的 行为 策略 ,但 只 能 等 到 博 
弈 结束 才 可 一 次 得 到 收益 。 

在 了 解 了 重复 博弈 的 特点 之 后 ,也 许 读者 会 问 ,既然 重复 博弈 是 动态 博弈 ,前 文 所 讨 
论 的 内 容 就 应 适用 于 本 章 。 那 么 ,重复 博弈 的 信息 结构 会 是 如 何 呢 ? 在 接 下 来 的 一 节 将 
告诉 你 这 些 内 容 。 


6.1.3 重复 博弈 的 信息 结构 


在 讨论 重复 博弈 的 具体 形式 之 前 ,有 必要 首先 了 解 一 下 多 阶段 博弈 的 信息 结构 。 除 
了 前 文中 信息 完全 和 信息 不 完全 的 区 别 外 ,在 多 阶段 博弈 中 一 般 还 存在 两 种 基本 的 信息 
结构 : 开 环 结构 和 闭环 结构 。 

开 环 结构 是 指 , 参 与 者 除了 自己 的 行动 和 日 程 之 外 看 不 到 任何 历史 ,或 者 在 博弈 的 一 
开始 参与 者 必须 选择 的 是 仅 依赖 于 日 程 时 间 的 行动 日 程 表 。 这 类 博弈 的 策略 的 特点 在 
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于 : 它们 只 是 日 程 时 间 的 函数 。 这 类 博弈 的 策略 就 称 为 开 环 策略 ,以 开 环 策略 构成 的 均 
衔 就 被 称 为 开 环 均衡 。 猜 拳 博弈 就 具有 开 环 策略 的 特征 。 在 多 阶段 的 猜拳 博弈 中 ,参与 
者 往往 可 以 在 事前 确定 自己 的 出 拳 顺 序 , 这 就 是 参与 者 选择 的 行动 日 程 表 。 

但 更 为 常见 的 是 ,博弈 人 在 选择 自己 的 行动 时 需要 根据 自己 所 看 到 的 历史 ,尤其 是 对 
手 在 此 前 采取 的 行动 而 做 出 决策 ,这 类 博弈 的 信息 结构 就 是 闭环 信息 结构 。 此 类 博弈 的 
策略 不 仅 依赖 于 日 程 时 间 ,还 依赖 于 其 他 的 变量 , 称 为 闭环 策略 (或 称 反馈 策略 ), 以 闭环 
策略 构成 的 均衡 称 为 闭环 均衡 。 田 尽 赛 马 博弈 ?就 具有 闭环 策略 的 特征 。 由 于 田 忌 的 各 
类 等 级 的 马 都 不 如 齐 威 王 ,因此 , 田 忌 要 取得 胜利 就 必须 有 针对 性 地 根据 齐 威 王 的 出 局 选 
择 自 己 的 策略 ,其 最 佳 策略 为 (上 ,下 )、( 中 ,上 )、(C 下 ,中 )。 这 样 ,尽管 田 忌 输 了 第 一 局 , 却 
赢得 了 第 二 、 第 三 局 ,从 而 取得 总 比赛 的 胜利 。 在 某 种 意义 上 , 田 忌 赛马 博弈 也 可 以 成 为 
团体 竞技 性 比赛 的 一 类 博弈 总 称 , 该 博弈 最 终结 果 往 往 取决 于 教练 临场 的 策略 选择 。 为 
了 赢得 策略 优势 ,每 一 个 参与 者 都 会 对 自己 的 策略 保密 。 

事实 上 ,在 绝 大 多 数 的 博弈 中 ,人 们 都 倾向 于 使 用 闭环 策略。 因此 ,本 章 也 将 重点 控 
讨 博弈 双方 知晓 历史 的 闭环 结构 重复 博弈 。 


6.2 构建 重复 博弈 


阐明 基本 概念 之 后 ,让 我 们 着 手 构建 重复 博弈 。 下 面 我 们 将 以 中 美 之 间 的 贸易 博弈 
作为 背景 ,构建 一 个 重复 博弈 。 
尽管 大 多 数 国家 都 相信 自由 贸易 应 该 是 公平 的 ,但 几乎 所 有 的 国家 都 不 同形 式 、 不同 
程度 地 实行 着 贸易 保护 主义 。 著 名 经 济 学 家 琼 ， 罗宾逊 夫人 曾 讽刺 贸易 保护 主义 说 : 
“不 能 因为 其 他 国家 往 他 的 港口 扔 石头 ,我 们 也 要 往 自 己 的 港口 扔 石头 .李斯 特 却 坚 定 地 
认为 ,相对 弱势 的 国家 要 想 维 护 本 国 的 经 济 发 展 , 就 必须 实行 关税 保护 的 政策 。 这 两 种 看 
似 矛 盾 的 理论 能 够 同 生 共存 , 究 其 实 是 由 于 不 同 的 思维 前 提 在 起 作用 。 如 今 ,贸易 保护 主 
义 不 仅 是 一 种 经 济 发 展 措施 ,而 且 也 成 了 国际 外 交 的 一 张 牌 。 有 和 句 谚 语 可 以 完美 地 诠释 
自由 贸易 的 槛 粹 处 境 : 实现 自由 贸易 就 像 上 天 党 ,每 个 人 都 想 去 但 又 不 想 太 早 。 作 为 两 
个 超级 大 国 , 中 美 经 济 贸易 关系 受制 于 政治 文化 等 因素 ,各 大 产业 的 经 贸 都 是 既 有 竞争 又 
有 合作 地 曲折 前 进 着 。 
< 案例 分 析 : 中 美 贸易 之 争 
“ 美 中 之 间 存 在 经 贸 摩擦 很 正常 ,即使 是 在 成 熟 的 贸易 伙伴 间 也 会 产生 摩擦 。” 
一 一 享 利 。 鲍 尔 森 ,美国 前 财 长 
“多 年 来 中 美 已 经 磨合 出 比较 成 熟 的 分 歧 处 理 方 式 , 双 方 爆发 贸易 战 或 货币 战 的 危险 
性 不 大 。” 
一 一 陈 凤 英 ,中 国 现代 国际 关系 研究 院 研 究 员 


@ 田鼠 赛马 博弈 请 参见 本 书 第 1 章 。 
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近期 中 美 贸易 之 争 引发 社会 各 界 广泛 关注 ,但 其 实 自 2008 年 金融 危机 爆发 以 来 ,中 
美 贸易 摩擦 就 日 益 频繁 且 不 断 升级 。 据 商务 部 统计 ,美国 在 2008 年 之 后 采取 贸易 救济 措 
施 的 频率 明显 增加 ,2008 年 1 月 至 2010 年 7 月 期 间 采取 的 贸易 救济 措施 占 总 量 的 46%。 
同时 涉案 金额 也 在 不 断 增加 ,2008 年 10 月 至 2009 年 7 月 ,美国 对 中 国贸 易 救 济 调查 涉 
案 金 额 约 50 亿美 元 , 占 同期 我 国 总 涉案 金额 的 54.42%。 其 中 ,“ 美 国 油井 管 “ 双 反 ' 案 涉 
案 金 额 32 亿美 元 ,是 迄今 为 止 中 国 遗 受 的 金额 最 高 的 贸易 教 济 措施 之 一 ; 美国 轮胎 特 保 
案 涉及 18 亿美 元 ,其 涉案 金额 在 所 有 对 中 国 采取 的 特 保 调查 中 也 是 最 高 的 。” 

可 见 ,2008 年 金融 危机 爆发 后 ,为 了 转移 国内 的 经 济 压力 ,美国 频频 向 中 国 出 口 商 品 
发 起 反倾销 和 反 补 贴 调查 ,同时 运用 技术 贸易 壁 笃 、 劳 动 贸易 壁 笃 等 非 关税 措施 来 限制 中 
国 商品 的 流入 。 针 对 美国 的 种 种 贸易 保护 行为 ,中 国 也 采取 了 相应 的 措施 ,其 中 之 一 就 是 
对 美国 商品 也 采取 “ 双 反 "调查 ,直至 采取 “ 双 反 "措施 。 表 6-1 仅 列举 了 一 部 分 双方 的 贸 
易 摩擦 事件 ,与 合作 间隙 。 

表 6-1 中 美 贸 易 摩擦 事件 摘录 

时 间 产品 详情 
美国 总 统 奥巴马 宣布 ,对 从 中 国 进口 的 所 有 小 轿车 和 轻型 卡 
车 轮胎 实施 为 期 三 年 的 惩罚 性 关税 
中 国 商务 部 发 布 公告 ,继续 对 原 产 于 美国 等 地 的 进口 聚 氢 忆 
燃 实 施 反倾销 措施 ,实施 期 限 为 5 年 
中 国 商务 部 发 布 公告 ,对 原 产 于 美国 等 地 的 聚 酰胺 一 6,6 切 
片 征收 最 高 37. 5% 的 反倾销 税 ,期 限 为 5 年 


中 美 双方 在 杭州 中 美 商贸 联 委 会 上 达成 共识 ,承诺 共同 反对 
贸易 和 投资 保护 主义 ,将 不 出 台新 的 贸易 保护 措施 


美国 商务 部 对 从 中 国 进口 的 无 颖 钢管 发 起 反倾销 和 反 补 贴 
税 调查 

美国 商务 部 公布 对 华 输 美 油井 管 反 倾销 反 补 贴 案 的 倾销 调 
2008 年 11 月 5 日 油井 管 查 初 裁 , 决 定 对 从 我 国 进口 的 油井 管 征收 最 高 达 99. 14% 的 
反倾销 税 


2008 年 9 月 11 日 轮胎 


2008 年 9 月 28 日 聚 氧 乙烯 


2008 年 10 月 12 日 聚 酰胺 


2008 年 10 月 29 日 es 


2008 年 10 月 30 日 无 颖 钢管 


美国 国际 贸易 委员 会 初步 裁定 ,对 从 中 国 和 印度 尼 西 亚 进口 
2008 年 11 月 6 日 铜版 纸 的 铜版 纸 、 从 中 国 进口 的 焦 磷酸 钾 、 磷 酸 二 氧 钾 和 磷酸 氧 二 
钊 征收 “ 双 反 ”关税 


中 国 商务 部 宣布 ,即日 起 对 原 产 于 美国 的 排 气 量 在 2.0 升 及 
2.0 升 以 上 进口 小 轿车 和 越野 车 发 起 反倾销 和 反 补 贴 调查 


美 将 继续 对 中 国 输 美 的 四 氢 糠 醇 征 收 136. 86% 的 反倾销 
税 , 实 施 期 限 为 5 年 


2008 年 11 月 6 日 汽车 


2008 年 11 月 23 日 四 氢 糠 醇 
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时 间 本 品 详 情 
当地 时 间 29 日 ,美国 商务 部 初步 裁定 ,对 从 中 国 进口 的 钢 格 
2008 年 12 29 
人 二 作 本 人 栅 板 征收 反倾销 税 。 关 税 最 高 145% 
美国 商务 部 5 日 表示 ,对 从 中 国 进口 的 价值 超过 3 亿美 元 的 
2009 年 1 月 6 日 钢丝 层 板 钢丝 层 板 征收 43% 一 289% 的 反倾销 关税 。 美 国 2008 年 从 
中 国 进口 价值 约 3.17 亿美 元 的 钢丝 层 板 
本 ye 
中 国 商务 部 发 布 公告 称 ,将 对 原 产 于 美国 的 排 气 量 在 2.5 升 
2011 年 12 月 14 日 | 汽车 以 上 的 进口 小 轿车 和 越野 车 征收 反倾销 税 和 反 补贴 税 ,实施 
期 限 2 年 
美国 商务 部 终 裁判 定 ,中 国 向 美国 出 口 的 晶体 硅 光伏 电池 及 
2012 年 1 产品 
Re 组 件 存在 倾销 和 补贴 行为 
美国 商务 部 1 日 宣布 初 裁 结果 ,认定 从 中 国 进口 的 碳 素 及 合 
2014 年 7 月 1 日 。 | 碳 素 及 合金 钢 | 金 钢 盘 条 存在 补贴 行为 ,对 中 国 出 口 的 上 述 产品 征收 相应 的 


保证 金 


2014 年 11 月 12 日 


中 美 两 国 就 加 强 双边 .地 区 和 全 球 层面 合作 达成 多 项 重要 成 
果 和 共识 


2015 一 2017 年 


中 美 贸易 度 过 了 一 段 相对 平稳 的 时 期 ,但 好 景 不 长 ,2017 年 
下 半年 美国 再 度 挑 起 争端 


2017 年 8 月 18 日 


技术 转让 知识 
产权 


美国 贸易 代表 宣布 正式 对 中 国 发 起 “301 调查 ”, 将 调查 中 国 
政府 在 技术 转让 知识 产权 、 创 新 等 领域 的 实践 ,政策 和 做 法 
是 否 不 合理 或 具 歧 视 性 ,以 及 是 否 对 美国 商业 造成 负担 或 
限制 


2018 年 1 月 22 日 


进口 太阳 能 电 
池 板 


美国 国际 贸易 委员 会 做 出 终 裁 , 美 国 将 对 从 中 国 进口 的 铝 条 
产品 征收 反倾销 和 反 补 贴 关 税 


2018 年 3 月 15 日 


铝 箱 产品 


美国 国际 贸易 委员 会 做 出 终 裁 ,美国 将 对 从 中 国 进口 的 铝 箱 
产品 征收 反倾销 和 反 补 贴 关 税 


2018 年 3 月 23 日 


128 项 产品 


中 国 商 务 部 发 布 了 针对 美国 进口 钢铁 和 铝 产 品 232 措施 的 
中 止 减 让 产品 清单 并 征求 公众 意见 , 拟 对 自 美 进口 部 分 产品 
加 征 关税 。 该 清单 暂 定 包含 7 类 、128 个 税 项 产品 ,涉及 美 对 
华 约 30 亿美 元 出 口 
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续 表 
时 间 天 品 详 情 
美国 在 世贸 组 织 争端 解决 机 制 项 下 向 中 方 提出 磋商 请 求 , 指 
2018 年 3 月 23 日 技术 许可 称 中 国政 府 有 关 技 术 许可 条 件 的 措施 不 符合 (与 贸易 有 关 的 
知识 产权 协定 》 的 有 关 规 定 


美国 贸易 代表 公布 对 华 301 调查 征 税 建议 ,并 公开 征求 意 
2018 年 4 月 3 日 1 300 项 产品 见 。 征 税 产品 建议 清单 将 涉及 我 约 500 亿美 元 出 口 ,建议 税 
率 为 25% ,涵盖 约 1 300 个 税 号 的 产品 


农产品 .汽车 、| 中 国政 府 宣布 将 对 原 产 于 美国 的 大 豆 等 农产品 ` 汽 车 化 工 
2018 年 4 月 4 日 a 品 飞 机 等 106 项 进口 商品 对 等 采取 加 征 关税 措施 ,税率 为 
25% ,涉及 2017 年 中 国 自 美国 进口 金额 约 500 亿美 元 


美国 商务 部 宣布 ,未 来 7 年 将 禁止 美国 公司 向 中 兴 通 讯 销 售 
2018 年 4 月 16 日 中 兴 通 讯 零 部 件 、 商 品 、 软 件 和 技术 , 因 中 兴 违 反 了 美国 限制 向 伊朗 出 
售 美国 技术 的 制裁 条 约 


中 国 宣布 对 原 产 美国 的 高 粱 实施 临时 反倾销 ,进口 经 营 者 应 
2018 年 4 月 17 日 高 梁 依据 初 裁 所 确定 的 各 公司 倾销 幅度 向 中 国 海关 提供 相应 保 
证 金 (比例 为 178.6%) 


美国 宣布 对 产 自 中 国 的 钢 制 轮 慌 产品 发 起 反倾销 和 反 补 贴 


2018 年 4 月 18 日 钢 制 轮 载 产品 调查 


商务 部 宣布 继续 对 原 产 于 美国 、 加 拿 大 、 巴 西 进口 浆 粕 实施 


2018 年 4 月 2 
年 4 月 20 日 浆 粕 反倾销 措施 


国际 贸易 战 频 发 , 虽 没有 硝烟 却 依旧 残酷 ,各 国 为 了 本 国 利益 ,一 次 次 筑 造 贸易 壁垒 ， 
开始 新 世纪 的 “国家 保卫 战 ”, 导 致 世界 上 最 大 的 两 个 经 济 体 之 间 贸 易 摩擦 一 度 升级 ,贸易 
保护 主义 悄然 抬头 。 然 而 , 谁 也 不 想 往 自己 的 港口 扔 石头 ,在 不 断 的 贸易 摩擦 之 中 ,中 美 
不 断 地 进行 着 关于 双方 贸易 自由 的 合作 谈判 。 

当 贸 易 保 护 主义 大 行 其 道 时 ,两 国 能 达成 协议 ,停止 相互 筑 造 贸易 壁垒 吧 ? 推 而 广 
之 ,本 来 各 自 为 营 的 主权 国家 ,又 因 何 愿意 各 让 一 步 , 主 动 达 成 合作 的 协议 呢 ? 这样 的 协 
议 对 双方 究竟 有 何 利 可 言 呢 ? 这 种 形式 的 合作 是 如 何 达成 并 得 到 维系 的 呢 ? 答案 就 是 博 
穿 。 通 过 博弈 论 ,人 们 能 够 实现 一 种 更 有 价值 的 合作 方式 。 随 后 ,我 们 将 根据 中 美 两 国 所 
面临 的 情形 创建 一 种 策略 式 博弈 。 


6.2.1 建立 阶段 博弈 


就 单一 阶段 而 言 , 自 由 畅通 的 国际 贸易 有 利于 国内 社会 整体 福利 的 提高 (但 可 能 会 影 
响 某 些 特定 主体 的 利益 ,如 类 似 产 品 的 国内 生产 商 )。 因 此 ,可 以 假设 如 果 两 国 均 清除 各 
种 进口 壁垒 ,实现 自由 贸易 ,其 各 自 的 所 得 为 8; 如 果 两 国 均 采取 贸易 保护 ,比较 优势 难以 
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发 挥 应 有 作用 ,资源 没有 被 充分 利用 ,各 自 的 所 得 为 5; 如 果 一 方 实 施 贸易 自由 策略 ,对 进 
口 商品 仅 征 收 较 低 的 关税 且 不 采取 任何 旨 在 限制 进口 的 非 关 税 措施 ,而 另 一 方 实行 贸易 
保护 主义 政策 ,在 正常 关税 之 外 ,设置 种 种 贸易 壁 允 限制 商品 的 流入 ,其 结果 就 是 ,采取 贸 


易 自由 策略 的 一 方 在 很 大 程度 上 丧失 了 国外 市 场 . 美国 

其 所 得 为 4, 而 采取 贸易 保护 策略 的 国家 则 保护 了 国 贸易 保护 ”贸易 自由 

内 市 场 同时 也 可 开拓 国外 市 场 ,其 所 得 增长 为 10。 贸易 保护 
两 国 各 自 的 策略 选择 与 所 得 可 用 图 6-3 表示 。 。 中 国 和 名 自由 | 


根据 对 内 徒 困境 模型 的 均衡 分 析 , 中 、 美 两 国 为 
了 实现 个 体 理性 , 即 追 求 自身 利益 最 大 化 ,不 会 采取 图 53 中 美 贸易 关系 内 徒 困境 
(贸易 自由 ,贸易 自由 ) 这 一 策略 组 合 ,因为 贸易 自由 

不 是 占 优 策略 ,双方 均 有 动机 改变 自己 的 选择 ,最 后 必然 稳定 在 (贸易 保护 ,贸易 保护 ) 这 
一 结果 上 ,该 结果 正 是 此 博弈 模型 的 纳什 均衡 。 可 见 ,选择 贸 易 保护 是 各 国 追求 个 体 理性 
的 结果 ,这 一 结果 必然 导致 两 国 间 的 贸易 摩擦 不 断 且 逐渐 升级 。 

很 显然 ,我 们 已 经 无 法 解释 在 国际 贸易 中 为 何 会 出 现 阶段 性 合作 了 。 是 哪里 弄 错 了 
吗 ? 难道 是 我 们 错 判 了 政治 家 的 喜好 ? 或 是 我 们 对 目标 的 假设 不 合理 ?为 了 寻求 突破 ， 
可 以 这 样 自问 : 为 什么 这 种 合作 行为 集中 出 现在 国际 贸易 摩擦 中 ,而 非 大 多 数 其 他 贸易 
纠纷 里 ?国际 贸易 的 一 个 独特 特点 是 国家 之 间 的 过 招 经 年 不 休 。 各 国之 间 的 国际 贸易 活 
动 不 是 一 次 性 的 ,而 是 经 年 累 月 地 面 对 相同 的 情境 (利益 关系 ) 并 做 出 决定 ,以 使 本 国 在 国 
际 贸易 中 获得 更 大 利益 。 

这 种 策略 性 互动 的 重复 是 解决 为 什么 会 在 国力 竞争 激烈 的 国际 贸易 里 出 现 合作 行为 
的 关键 ,也 是 本 章节 所 要 探讨 的 。 在 许多 策略 性 场景 中 ,重复 遭遇 能 够 维持 合作 ,通过 合 
作 , 每 个 人 获得 的 收益 要 高 于 一 次 性 博弈 产生 的 收益 。 在 6. 2. 2 节 , 我 们 会 正式 创建 一 个 
重复 博弈 。 接 着 ,在 6. 2. 3 节 和 6.2.4 节 中 分 析 这 个 国际 贸易 博弈 。 当 然 , 在 进一步 的 分 
析 中 ,我 们 首先 假设 世界 永远 太平 ,各 国 的 国际 贸易 能 够 无 限 持续 下 去 。 


6.2.2 创建 一 个 重复 博弈 


所 谓 重 复 博弈 ,就 是 指 所 有 参与 者 周而复始 地 面 对 相 同 的 遭遇 一 一 阶段 博弈 的 一 种 
情形 。 阶 段 博弈 是 构成 重复 博弈 的 组 件 , 或 者 可 以 构成 有 几 个 固定 步骤 的 其 他 博弈 。 例 
如 ,图 6-3 的 博弈 就 是 阶段 博弈 , 它 将 最 终 演变 成 一 场 拉锯 战 。 从 阶段 博弈 到 重复 博弈 的 
演变 过 程 中 ,我 们 有 必要 重新 定义 一 下 游戏 规则 和 收益 机 制 。 因 为 策略 完全 是 为 博弈 规 
则 制定 的 ,所 以 如 果 一 个 参与 者 被 期 望 有 多 次 而 不 是 一 次 遭遇 ,那么 这 一 套 行 之 有 效 的 规 
则 将 有 不 同 的 表现 。 至 于 收益 ,我们 会 很 自然 地 认为 参与 者 不 单 考虑 当前 处 境 所 产生 的 
收益 ,也 会 考虑 所 有 未 来 可 能 的 遭遇 。 

假设 中 美 双方 预计 会 按照 图 6-4 所 示 的 方式 发 生 工 次 贸易 往来 。 两 国 在 未 来 ”年 每 
月 交易 一 次 共 持 续 工 次 。 不 妨 假设 ,在 图 6-4 每 一 对 有 序 的 行为 组 合 中 首次 的 行动 都 是 
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因 我 国 发 起 的 ,但 是 美国 具有 不 完美 信息 ,因此 每 个 阶段 博弈 在 本 质 上 等 同 于 图 6-3 所 表 
示 的 同时 行动 静态 博弈 。 在 图 6-4 所 示 的 博弈 中 ,贸易 保护 (或 者 贸易 自由 ) 是 一 个 策略 ， 
但 是 在 重复 博弈 中 这 一 策略 更 加 复杂 ,被 定义 为 一 种 行动 (action)。 在 重复 博弈 中 策略 
的 概念 等 同 于 其 他 任何 形式 的 博弈 。 对 于 一 个 参与 者 来 说 ,策略 仅 适 用 于 根据 每 个 信息 
所 设 定 的 行动 。 因 此 ,一 个 策略 如 何 , 取 决 于 他 做 出 行动 时 所 掌握 的 信息 。 

中 国 


贸易 保护 贸易 自由 


贸易 自由 ”贸易 保护 贸易 自由 


左 ; 保护 
右 : 自由 
10 159 1315 2014 189 148 1213 1812 16 
I0..9.13. :139 814 1215 1420 18 13 1218 16 


图 6-4 T=2 时 国际 贸易 重复 博弈 树 状 图 


现实 中 的 信息 模式 多 为 闭环 信息 ,也 就 是 说 参与 者 在 采取 下 一 次 行动 时 ,知晓 之 前 其 
他 参与 者 行为 的 历史 信息 。 因 此 ,本 章 将 重点 探讨 一 个 历史 (参与 者 过 去 的 行动 ) 是 共有 
知识 的 案例 ,正如 图 6-4 中 的 博弈 所 反应 的 。 实 际 上 ,我 们 可 以 看 出 一 个 简单 的 策略 就 可 
以 重新 解释 关于 国际 贸易 的 疑惑 。 

注 : 对 于 一 场 不 确定 有 多 少 阶段 的 博弈 (T 一 无 穷 )。 由 于 与 此 相关 的 信息 模式 的 数 
量 是 不 确定 的 ,此 策略 所 包含 的 可 能 行动 的 数量 也 是 不 确定 的 。 一 个 策略 可 能 超 乎 想象 
的 复杂 ,在 此 我 们 暂 不 做 讨论 。 

重复 博弈 的 另 一 个 组 成 要 素 便 是 收益 。 正 如 阶段 博弈 中 的 策略 在 重复 博弈 中 表现 为 
一 种 行动 ,阶段 博弈 中 的 收益 在 重复 博弈 中 仅 表现 为 一 个 阶段 的 收益 。 重 复 博弈 中 参与 
者 的 收益 受到 每 一 个 独立 阶段 所 获 收 益 的 影响 。 例 如 , 当 T=5 时 双方 博弈 的 策略 组 合 
为 : { (贸易 自 由 ,贸易 自由 ),( 贸 易 保 护 , 贸 易 自 由 ), (贸易 自 由 ,贸易 自由 ),( 贸 易 自 由 ， 
贸易 保护 ), (贸易 保护 ,贸易 保护 )} 。 该 组 合 表示 : 在 第 1 阶段 中 美 同时 采取 贸易 自由 行 
动 ,在 第 2 阶段 中 国 采取 贸易 保护 而 美国 采取 贸易 自由 。 从 图 6-4 可 知 ,我 国 每 一 个 独立 
阶段 的 收益 分 别 为 (8,10,8,4,5)。 

考虑 到 资本 (收益 ) 的 时 间 价值 ,因此 各 个 阶段 并 非 同 等 重要 。 进 一 步 ,使 用 阶段 收益 
的 简单 加 总 并 不 能 准确 衡量 多 个 阶段 的 收益 。 换 言 之 ,每 个 人 都 希望 尽早 拿 到 应 得 的 收 
益 ,而 未 来 的 收益 将 会 有 一 个 折扣 。 基 于 这 种 想法 ,我 们 应 该 考虑 另 一 种 带 权重 的 收益 之 
和 。 阶 段 越 靠 后 ,数据 的 权重 则 越 小 (而 不 是 把 多 个 独立 阶段 的 收益 简单 加 总 ) 。 我 们 用 
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ww 表示 阶段 上 所 得 的 收益 ,那么 总 计 收 益 表示 为 wt 十 wzuz 十 十 wiui 十 … 十 wTuT, 其 
中 : ml 二 …>zwT 二 0。 研 究 者 们 更 喜欢 用 下 列 形 式 表示 权重 ww 一 8 1 ,其 中 0<6 过 
1。 6 的 经 济 意义 为 折 现 因子 或 折 现 系数 ,用 来 衡量 未 来 收益 折算 到 现在 价值 的 要 素 。 简 
言 之 , 现 值 是 指 经 折 现 系数 打折 后 的 所 有 单一 阶段 收益 的 和 ,我 们 计算 收益 时 采用 现 值 的 
概念 能 更 为 准确 地 反映 多 阶段 的 收益 总 和 。 

总 之 ,阶段 +: 上 的 数据 权重 ( 折 现 系数 ) 等 同 于 分 数 6 的 “1 一 1” 次 方 。 我 们 都 知道 一 个 
数字 乘 以 分 数 就 会 变 小 ,因此 权重 一 定 会 减 小 (除非 6 为 0 或 1, 此 时 它们 分 别 恒 等 于 0 或 
1)。 例 如 ,6 二 0.6。 那 么 避 ! 二 1 ,wz 二 0.6,tws 二 0.36,rw4 二 0.216,… 当 权重 以 这 种 形式 表 
示 时 ,整个 博弈 的 要 素 之 和 被 认为 是 所 有 阶段 博弈 收益 的 现 值 之 和 ,表示 为 wi 十 6uz 十 … 十 
Flu 二 TOT lur。 


6.2.3 ”有限 次 重复 博弈 


随 着 重复 博弈 的 建立 ,我 们 距离 解释 中 美国 际 贸易 中 出 现 阶段 性 合作 的 原因 更 近 了 
一 步 。 首 先 假设 中 国 与 美国 进行 了 两 次 交易 (T= 二 2) ,并 且 贸 易 双 方 都 试图 使 单一 阶段 的 
收益 之 和 最 大 化 (6 二 1) 。 此 时 博弈 情况 正如 图 6-4 所 示 。 

这 场 博 弈 其 实 只 是 前 面 章节 探讨 的 博弈 的 扩展 形式 。 回 顾 前 面 的 内 容 ,我们 选择 的 
解决 方案 是 一 个 子 博弈 完美 纳什 均衡 ,而 这 一 均衡 可 以 用 逆向 归纳 法 解决 。 从 图 6-4 中 ， 
我 们 可 以 看 到 共有 5 个 子 博弈 : 这 场 博弈 自身 及 第 二 阶段 的 4 个子 博弈 。 而 逆向 归纳 法 
让 我 们 能 够 解决 纳什 均衡 的 4 个 子 博弈 。 

我 们 从 探讨 双方 在 第 1 阶段 都 选择 贸易 保护 策略 的 子 博弈 开始 。 图 6-5 给 出 了 这 一 
策略 的 表现 形式 , 且 我 们 很 容易 证 实 它 有 唯一 的 纳什 均衡 (贸易 保护 ,贸易 保护 )。 因 此 ， 
如 果 双 方 在 第 1 阶段 都 选择 了 贸易 保护 , 子 博弈 完美 纳什 均衡 会 令 双 方 在 第 2 阶段 做 出 
同样 的 选择 。 

现在 思考 这 样 一 个 子 博弈 : 第 1 阶段 ,中 国 选择 贸易 保护 而 美国 选择 贸易 自由 。 
图 6-6 描述 了 这 一 策略 形式 。 这 里 (贸易 保护 ,贸易 保护 ) 还 是 唯一 的 纳什 均衡 ,而 我 们 也 
很 容易 证 实 : (贸易 保护 ,贸易 保护 ) 在 其 他 二 阶段 子 博弈 中 也 是 唯一 的 纳什 均衡 。 

练习 : 你 能 写 出 任意 二 阶段 子 博弈 中 纳什 均衡 的 求解 过 程 吗 ? 

美国 美国 
贸易 保护 ”贸易 自由 贸易 保护 ”贸易 自由 


中 国 贸易 保护 | oo | 159 | 8 贸易 保护 
贸易 自由 贸易 自由 


图 6-5 (贸易 保护 ,贸易 保护 ) 之 后 贸易 图 6-6 (贸易 保护 ,贸易 自由 ) 之 后 贸易 
双方 博弈 第 2 阶段 的 子 博弈 双方 博弈 第 2 阶段 的 子 博弈 


作为 逆向 归纳 法 的 一 部 分 ,4 个 子 博弈 中 的 每 一 个 都 被 相关 的 纳什 均衡 的 收益 所 蔡 
代 。 按 照 这 一 步骤 发 展 下 去 会 导致 图 6-7 所 示 的 结果 , 它 清楚 明了 地 表明 所 描述 的 博弈 
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具有 唯一 的 纳什 均衡 (贸易 保护 ,贸易 保护 )。 但 是 博弈 双方 都 选择 这 一 贸易 保护 策略 是 
出 人 意料 的 ,因为 显然 双方 的 选择 并 没有 达到 自己 能 够 得 到 的 最 大 利益 。 如 果 把 所 有 的 
分 析 连 在 一 起 ,我 们 就 会 发 现 图 6-4 中 第 2 阶段 的 贸易 博弈 有 唯一 的 子 博弈 完美 纳什 均 
衡 。 而 这 场 博弈 的 一 系列 结果 会 使 他 们 在 阶段 1 和 阶段 2 都 选择 贸易 保护 。 

中 国 


贸易 保护 时 易 自 由 
关 国 Ee EN 
贸易 保护 贸易 自由 
中 国 ”10 15 9 13 
美国 ”10 9 15 13 


图 6-7 道 向 归纳 后 的 两 阶段 国际 贸易 的 第 1 阶段 


至 此 ,读者 也 许 疑 惑 一 一 为 何 没有 接近 这 一 目标 : 将 “贸易 自由 ”纳入 两 国 的 均衡 策 
略 。 虽 然 上 文 完 成 了 由 单 阶段 推 至 两 阶段 的 过 程 , 但 是 在 此 基础 上 类 推 后 读者 不 难 发 现 : 
更 长 时 期 内 的 贸易 往来 行为 对 分 析 并 无 帮助 。 不 管 历经 10 个 阶段 还 是 100 个 、1 000 个 
阶段 甚至 100 万 个 阶段 ,只 要 它 在 有 限 次 后 终止 ,都 只 有 唯一 的 策略 均衡 : 双方 都 采取 贸 
易 保 护 主义 维护 本 国 利益 。 

假设 一 场 博弈 要 经 历 工 个 阶段 而 此 时 已 是 最 后 阶段 ,总 收益 就 是 所 有 单一 阶段 的 收 
益 之 和 。 令 CT 和 A 一 ! 分 别 表示 前 一 1 个 阶段 中 国 与 美国 的 收益 之 和 。 可 以 看 到 ,下 
阶段 面 对 的 子 博弈 如 图 6-8 所 示 。 我 们 所 做 的 仅 是 用 图 6-8 表示 这 个 阶段 博 穿 ( 第 了 阶 
段 ) ,并 且 将 C7 :加 到 中 国 的 收益 上 ,将 A7™! 加 到 美国 的 收益 上 。 当 然 ,如 果 在 一 次 贸易 
博弈 中 ,贸易 保护 ?压倒 “贸易 自由 ?” 占 主导 地 位 ,那么 就 算 我 们 给 每 个 收益 加 上 一 个 常数 
(T 一 1 阶段 的 历史 收益 累积 C7 和 AT51) ,收益 的 比较 结果 还 是 一 样 的 。 在 作为 最 后 阶 
段 的 第 工 阶 段 ,很 显然 对 双方 来 说 ,采取 贸易 保护 是 最 佳 策略 , 仍 不 会 偏离 单 次 博弈 的 纳 
什 均衡 。 


美国 
贸易 保护 贸易 自由 
贸易 保护 CTI+5, ATI+5 CT™I+10, A!'+4 


中 国 


图 6-8 阶段 的 子 博弈 


现在 逆 推 第 T 一 1 阶段 的 情形 。 因 为 第 TT 一 2 阶段 之 前 的 收益 之 和 已 经 确定 , 当 两 国 
进入 第 T 一 1 阶段 博弈 时 , 面 对 的 实质 上 仍然 是 图 6-3 中 的 囚徒 困境 博弈 ,必然 会 出 于 当 
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前 利益 最 大 化 的 考虑 ,再 次 选择 贸易 保护 主义 。 

这 一 推论 可 以 说 明 双 方 在 T 一 2,T 一 3 阶段 直到 倒退 至 第 1 阶段 都 会 选择 贸易 保护 
作为 策略 。 因 为 ,在 双方 面临 阶段 工 的 博弈 时 ,第 T 一 1 阶段 的 收益 不 会 再 发 生 改 变 , 也 
不 会 受 贸易 双方 T 阶段 的 行动 影响 。 因 此 ,最 明智 的 行为 意味 着 选择 最 大 化 当前 收益 的 
策略 。 正 如 图 6-8 所 示 的 博弈 ,贸易 保护 显然 是 最 佳 策略 。 到 了 阶段 T 一 1, 之 前 的 总 收 
益 也 是 固定 的 且 不 受 阶段 了 一 1 策略 的 影响 ,所 以 阶段 T 一 1 的 情形 仍然 像 一 次 性 博弈 : 
T 一 1 阶段 的 行动 只 会 影响 T 一 1 阶段 的 收益 , 且 T 一 2 阶段 的 行动 只 会 影响 T 一 2 阶段 
的 收益 ,总 之 过 去 的 事情 是 无 法 改变 的 ,将 来 要 发 生 什么 也 不 受 其 他 阶段 影响 。 也 就 是 
说 ,T 一 2 阶段 的 情形 依然 像 一 次 性 博弈 。 这 种 逻辑 可 以 被 持续 应 用 到 未 来 任 一 阶段 , 因 
此 在 任 一 阶段 双方 都 会 选择 贸易 保护 。 

这 一 逻辑 不 仅 可 以 运用 到 重复 的 贸易 博弈 中 ,也 可 以 运用 到 任何 有 特定 阶段 的 重复 
博弈 中 ,只 要 这 种 博弈 的 阶段 博弈 存在 纳什 均衡 。 对 于 阶段 博弈 来 说 ,纳什 均衡 的 重要 性 
在 于 它 能 够 确定 最 后 一 个 阶段 博弈 双方 的 选择 。 因 此 可 以 得 出 这 一 结论 , 即 倒数 第 2 阶 
段 的 行为 不 会 影响 最 后 一 个 阶段 的 选择 。 以 此 类 推 ,每 一 阶段 的 博弈 都 是 当前 的 “最 后 一 
次 ”博弈 ,其 之 前 的 博弈 不 会 影响 博弈 双方 的 选择 ,那么 实质 上 ,每 一 阶段 的 博弈 都 依然 是 
一 次 性 博弈 ,重复 地 归纳 到 任何 阶段 直到 初始 阶段 ,博弈 的 双方 都 会 选择 做 出 能 达到 纳什 
均衡 的 行为 。 

阶段 性 结论 : 如 果 阶 段 博弈 G 有 唯一 的 纳什 均衡 ,对 于 任 一 有 限 次 重复 博弈 G' 来 
说 ,始终 重复 阶段 博弈 中 的 纳什 均衡 ?这 一 策略 是 唯一 的 子 博 弈 完美 纳什 均衡 。 博 弈 双 
方 没有 可 预见 的 合作 ,只 有 始终 如 一 的 竞争 。 


6.2.4 无 限 次 重复 博弈 


有 限 次 重复 的 贸易 博弈 存在 一 个 隐 含 的 重要 特征 , 即 贸 易 双方 明确 地 知道 交易 何 时 
会 走向 终止 。 这 一 特征 是 分 析 的 关键 ,因为 我 们 要 讨论 何 时 是 一 场 博弈 的 最 后 阶段 。 如 
果 参 与 者 知道 这 是 最 后 一 次 交易 ,他 们 就 会 像 前 文 的 分 析 一 样 , 把 自己 面 对 的 博弈 看 成 是 
一 次 性 博弈 。 然 而 在 现实 中 ,尽管 贸易 双方 存在 着 摩擦 和 一 系列 的 问题 ,但 是 他 们 心中 清 
楚 地 明白 : 只 要 世界 经 济 可 持续 运行 ,他 们 之 间 的 贸易 往来 就 不 会 停止 。 

如 果 一 场 博弈 不 具备 “信息 透明 "这 一 特性 , 则 意味 着 这 场 博弈 所 持续 的 阶段 是 不 明 
期 界 ,博弈 双方 并 不 能 确定 哪 一 阶段 是 博弈 的 终止 时 点 ,也 就 是 说 这 场 博 蛮 有 持续 下 去 的 
可 能 ,但 是 参与 者 并 不 能 明确 判定 。 例 如 ,假设 每 一 阶段 ,中 美 再 次 与 对 方 交易 的 概率 为 
户 ,因此 当前 的 交易 是 他 们 最 后 一 次 交易 的 概率 为 1 一 p。 有 一 点 是 很 重要 的 ,参与 国 在 决 
定 如 何 做 时 ,他 们 不 确定 在 未 来 是 否 会 与 对 方 再 次 交易 (他 们 的 关系 有 持续 下 去 的 可 能 ， 
但 只 是 可 能 )。 但 当 2 一 1 时 ,博弈 具有 无 限期 界 , 参 与 国 的 交易 也 肯定 会 持续 下 去 。 

正如 现实 世界 中 美 不 会 断交 ,我们 假设 这 场 博弈 是 无 限 次 的 。 但 是 也 要 记 住 “参与 者 
从 来 都 不 知道 当前 阶段 是 他 们 相互 影响 的 最 后 阶段 ”, 是 这 一 假设 成 立 的 决定 性 条 件 。 值 
得 注意 的 是 ,这 场 博弈 所 持续 的 阶段 是 不 确定 的 (0 二 p 二 1) 还 是 无 限 次 的 (p 二 1) ,将 分 别 
导致 不 同 的 结果 ,这 涉及 动态 规划 的 内 容 , 本 书 不 再 展开 。 有 兴趣 的 同学 可 以 自行 参阅 相 
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关 书 籍 。 

无 限 次 重复 博弈 的 策略 规定 了 每 个 历史 时 期 每 个 阶段 参与 者 的 行为 。 与 有 限 次 重复 
博弈 的 分 析 不 同 的 是 ,因为 不 存在 最 后 的 子 博弈 去 开始 这 个 过 程 ( 哪 一 阶段 是 最 后 的 子 博 
弈 不 能 确定 ) ,逆向 归纳 法 并 不 适用 于 无 限 次 重复 博弈 。 同 时 ,尽管 我 们 缺少 一 个 快速 得 
出 子 博弈 完美 纳什 均衡 的 方法 ,但 是 依然 可 以 提出 一 些 候选 策略 ,看 是 否 是 纳什 均衡 。 

在 不 完美 信息 下 的 动态 博弈 中 ,对 每 个 子 博弈 而 言 , 子 策略 就 是 一 个 纳什 均衡 ,这 个 
策略 被 定义 为 子 博 弈 完美 纳什 均衡 。 子 策略 是 参与 者 策略 的 一 部 分 ,而 对 应 的 子 博 弈 仅 
仅 决定 了 由 子 博 弈 中 的 信息 模式 所 规定 的 行动 。 类 似 地 有 如 下 重复 博弈 中 的 子 博弈 完美 
纳什 均衡 的 定义 。 

子 博弈 完美 纳什 均衡 : 在 一 个 重复 博弈 中 ,对 于 某 一 参与 者 的 某 一 策略 来 说 ,给 定 

(1) 其 他 参与 者 在 当前 阶段 按照 他 们 自己 的 策略 行事 ， 

(2) 所 有 参与 者 (包括 替补 参与 者 ) 将 来 按照 他 们 的 策略 行事 ， 

当 且 仅 当 每 个 历史 时 期 的 每 一 阶段 该 策略 所 规定 的 行为 都 是 该 参与 者 的 最 佳 选 择 ， 
满足 这 一 条 件 的 策略 就 是 子 博弈 完美 纳什 均衡 。 换 言 之 ,假如 其 他 参与 者 按 照 他 们 的 策 
略 行事 且 第 一 个 参与 者 将 来 按照 他 的 策略 行事 ,此 时 那个 特定 的 参与 者 的 策略 就 能 为 其 
指定 最 佳 行为 。 

为 了 直截了当 地 解决 问题 ,我们 只 需 博 弈 的 某 一 方 是 忠于 自己 策略 的 参与 者 ,在 一 些 
背叛 行为 发 生 后 他 依然 会 遵从 自己 的 策略 。 我 们 将 以 此 为 基础 寻找 无 限 重复 博弈 中 的 纳 
什 均衡 。 

首先 ,我 们 来 看 一 个 简单 的 策略 : 任何 阶段 ,任何 时 候 ,博弈 双方 都 选择 贸易 保护 。 
尽管 过 去 这 一 策略 并 没有 令 每 一 个 参与 者 为 他 所 作 的 选择 负责 ,但 是 请 记 住 , 这 仅仅 是 因 
为 过 去 对 每 一 个 参与 者 而 言 ,让 自己 的 行为 可 能 发 生 而 非 必 须 做 出 某 种 行为 是 有 可 行 性 
的 。 接 着 让 我 们 证 明 : 如 果 中 美 双方 都 选择 这 一 策略 ,那么 对 无 限 次 重复 的 贸易 博弈 而 
, 它 将 是 一 个 子 博弈 完美 纳什 均衡 。 

在 这 个 简单 的 博弈 中 ,不 管 处 于 哪 一 阶段 ,哪个 历史 时 期 ,两 个 参与 者 的 策略 都 要 求 
他 们 做 出 同样 的 行为 : 贸易 保护 。 从 而 ,当前 阶段 及 所 假设 的 每 一 阶段 参与 者 都 希望 得 
到 两 个 单位 的 收益 。 这 一 选择 使 参与 者 获得 的 当前 收益 为 

5 十 SGX5 十 8 X5 十 963 X5 十 … 


其 中 8 是 折 现 因子 (系数 ) 。 
为 了 对 比 , 若 一 方 在 当前 阶段 选择 贸易 自由 ,此 后 仍然 采 择 贸易 保护 。 此 时 收益 为 
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根据 这 一 策略 ,选择 贸易 自由 的 一 方 今天 将 得 到 4 个 单位 的 收益 (参与 者 本 身 都 倾向 
于 贸易 保护 ) 而 未 来 得 到 5 个 单位 的 收益 ( 据 他 们 的 策略 ,出 于 保护 本 国生 产 企 业 双方 都 


会 选择 贸易 保护 ) 。 很 显然 , 当 9<<1 时 ,- > 成立, 所 以 贸易 保护 产生 的 收益 较 高 ， 
即 该 策略 是 子 博弈 完美 纳什 均衡 。 还 有 另 一 点 可 以 解释 为 什么 贸易 保护 这 一 策略 更 受 参 
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与 者 青睐 , 那 就 是 当前 阶段 此 策略 产生 较 高 的 收益 (5 对 4), 且 未 来 所 得 收益 与 另 一 策略 
产生 的 收益 相同 。 

至 此 我 们 已 经 证 明 出 : 只 要 中 美 一 直 保 持 贸 易 往 来 ,每 一 阶段 双方 都 采取 贸易 保护 
措施 就 是 一 个 子 博弈 完美 纳什 均衡 。 但 是 ,这 依然 与 我 们 要 解释 中 美 双方 国际 贸易 发 生 


合作 的 目标 背道而驰 。 
考虑 到 之 前 的 策略 比较 “简单 粗暴 ,没有 合作 共 赢 的 可 能 性 。 现 在 我 们 思考 下 面 的 
这 对 策略 组 合 : 


(1) 阶段 1: 选择 贸易 自由 。 

(2) 阶段 i(1 宇 2): 如 果 双 方 过 去 一 直 都 选择 贸易 自由 , 则 选择 贸易 自由 ; 否则 ,选择 
贸易 保护 。 

如 果 双 方 都 采用 这 一 策略 ,那么 他 们 将 选择 合作 的 方式 以 贸易 自由 开始 这 场 博 弈 ( 事 
实 会 证 明 , 善 有 善 报 , 怀 着 善意 结果 总 会 好 些 )。 只 要 双方 一 直 遵 守 合作 原则 ,没有 谁 先 采 
取 贸 易 保护 ,这 一 规则 会 永远 得 以 存续 。 但 是 只 要 有 人 违背 游戏 规则 (一 方 首先 贸易 保 
护 ) ,那么 之 后 双方 都 会 放弃 合作 选择 贸易 保护 。 这 就 是 我 们 所 说 的 “冷酷 策略 ”。 任 何 违 
背 游 戏 规则 的 行动 都 会 招致 惩罚 , 那 就 是 双方 在 未 来 确定 的 阶段 都 会 贸易 保护 。 

如 果 双 方 都 采用 "冷酷 策略 ”, 会 导致 大 家 所 渴望 的 国际 贸易 合作 吗 ? 换言之 ,每 个 阶 
段 参与 者 都 不 会 使 用 贸易 保护 来 打压 对 方 吗 ? 我 们 所 要 做 的 就 是 证 明 这 个 策略 是 一 个 均 
衡 ,更 具体 的 证 明正 是 基于 这 一 策略 参与 者 在 任何 历史 时 期 的 任何 阶段 都 做 出 了 最 明智 
的 选择 。 从 表面 上 看 ,这 确实 很 难 。 因 为 这 场 博弈 经 历 了 无 限 个 阶段 ,无限 个 历史 时 期 。 
让 我 们 考虑 如 下 两 个 案例 。 

首先 ,设想 这 样 一 个 阶段 ,在 此 阶段 没有 人 选择 贸易 保护 。 这 个 阶段 可 以 是 第 1 阶段 
也 可 以 是 之 后 的 任何 阶段 ,不 过 之 前 双方 都 选择 贸易 自由 。 如 果 一 个 国家 的 策略 是 选择 
贸易 自由 ,那么 其 期 望 收益 为 
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8+6X8+6 X8+HX8+ = Is (6-3) 


因为 选择 贸易 自由 的 国家 也 不 希望 交易 对 手 采取 贸易 保护 .并且 希 望 未 来 双方 都 保 
持 贸易 自由 。 为 了 证 明 后 一 主张 的 正确 性 ,每 个 参与 者 都 希望 所 有 的 参与 者 未 来 按照 他 
们 自己 的 策略 行事 。 如 果 中 美 双方 当前 阶段 都 选择 贸易 自由 ,那么 根据 两 国 所 采用 的 冷 
酷 策略 ,下 一 阶段 它们 也 不 会 用 贸易 保护 打压 对 方 。 因 为 之 前 的 任何 阶段 没有 一 方 打破 
合作 ,采取 贸易 保护 ,这 个 推理 也 适用 于 之 后 的 任何 阶段 。 

这 一 策略 产生 的 收益 在 当前 阶段 大 于 等 于 其 他 策略 产生 的 收益 时 才能 达到 均衡 。 为 
了 对 比 ,唯一 的 选择 就 是 贸易 保护 ,贸易 保护 所 产生 的 收益 为 


10+6X5+6 X5+. =10+6(T3) (6-4) 


所 以 ,对 方 背叛 合作 而 采取 贸易 保护 时 能 获得 较 高 的 当前 收益 10。 但 是 这 个 策略 是 
以 得 到 应 有 的 惩罚 为 代价 的 : 据 双 方 的 策略 ,他 们 在 确定 的 阶段 通过 贸易 保护 的 方式 回 
应 那些 背叛 贸易 自由 的 参与 者 ,这 样 获得 较 低 的 收益 5。 
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为 使 贸易 自由 策略 产生 的 收益 在 当前 阶段 大 于 等 于 其 他 策略 产生 的 收益 ,以 满足 均 
衡 条 件 ,需要 使 式 (6-3) 大 于 等 于 式 (6-4), 即 


Ts>10+6(T 3) (6-5) 


一 旦 满足 不 等 式 (6-5) ,此 时 每 一 方 参与 者 都 愿意 选择 “贸易 自由 ”作为 自己 的 策略 。 
这 一 对 策略 (或 称 策略 组 合 ) 才 成 为 一 个 子 博弈 完美 纳什 均衡 。 

请 注意 ,一 个 策略 必须 为 每 一 历史 时 期 每 一 阶段 的 行为 提供 最 准确 的 指示 。 我 们 已 
经 评价 了 每 一 历史 时 期 每 一 阶段 这 一 策略 的 最 优 性 。 但 是 这 一 策略 并 不 是 长 久 的 最 佳 策 
略 , 因 为 当 且 仅 当 不 等 式 (6-5) 成 立时 ,冷酷 策略 ? 才 是 一 个 子 博弈 完美 纳什 均衡 。 而 不 
等 式 (6-5) 成 立 的 条 件 是 过 1/2。 

从 上 述 式 子 可 以 看 到 ,如 果 6 三 1/2, 这 个 "冷酷 策略 ”就 能 满足 子 博弈 完美 纳什 均衡 
的 条 件 。6 三 1/2 意味 着 双方 要 有 足够 的 耐心 。 只 要 双方 对 未 来 有 足够 的 耐心 ,对 未 来 收 
益 的 折 现 就 会 足够 高 。 当 折 现 因子 大 于 1/2 时 ,冷酷 策略 就 是 一 个 均衡 一 一 请 注意 ,是 一 
个 均衡 。 因 为 一 般 来 讲 可 能 存在 的 均衡 不 止 一 个 。 到 此 为 止 , 中 美国 际 贸易 中 会 出 现 合 
作 这 一 问题 得 到 了 圆满 的 解决 。 

满足 条 件 9 三 1/2 是 维持 合作 关系 的 一 般 原则 。 我 们 设想 双方 一 直 保 持 一 致 , 采 用 
贸易 自由 。 如 前 所 述 , 如 果 一 方 选择 贸易 自由 ,并 且 和 希望 继续 维系 合作 关系 ,该 国 所 获 
得 的 当前 收益 及 未 来 收益 都 为 8。 相 反 , 如 果 有 一 方 贸易 保护 ,双方 都 会 卷 人 残酷 的 贸 
易 之 争 ,这样 它 将 获得 10 个 单位 的 当前 收益 ,但 是 未 来 每 个 阶段 的 收益 仅 为 5。 这 是 
中 美 双 方 每 个 阶段 都 在 面 对 的 一 场 交 易 , 即 愿 不 愿意 用 当前 收益 的 增加 换取 未 来 收益 
的 下 降 。 

为 了 达到 均衡 ,中 美 贸易 之 间 的 合作 一 旦 发 生 背 叛 ,所 导致 的 未 来 损失 必须 高 于 当前 
收益 才 行 。 因 此 ,博弈 双方 对 于 未 来 的 重视 程度 就 成 为 均衡 是 否 发 生 改变 的 重要 考量 。 
易 知 6 的 值 越 大 ,对 未 来 收益 的 赋 权 越 大 ,足够 大 时 才能 维持 合作 均衡 。 对 此 ,我 们 的 条 
件 非常 明确 ; 为 了 使 “冷酷 策略 ?达到 均衡 ,8 值 不 能 低 于 1/2。 

为 什么 只 要 调整 了 双方 的 基准 策略 (从 选择 最 简单 的 策略 到 “冷酷 策略 ”) ,均衡 就 会 
有 改变 的 契机 ? 这 里 隐 含 着 一 个 重要 事实 : 博弈 双方 会 赁 着 自己 每 一 个 阶段 的 行动 得 到 
奖惩 。 不 同 的 奖惩 方案 可 能 会 造就 不 同 的 纳什 均衡 。 

因此 ,在 我 们 的 分 析 中 最 重要 的 是 奖惩 方案 。 一 方面 ,如 果 美 国保 持 合 作 的 协定 ,中 
国会 在 未 来 报答 美国 的 这 一 行动 ,未 来 交易 时 尽量 采用 贸易 自由 ; 另 一 方面 ,如 果 美 国 违 
背 了 合作 协定 ,那么 中 国 也 会 做 出 回应 ,惩罚 这 一 行动 。 这 一 奖惩 方案 对 于 中 国 也 同样 适 
用 。 从 而 ,我 们 得 出 如 下 结论 。 中 美 双方 维持 合作 不 是 由 于 国家 之 间 的 友谊 ,而 是 出 于 国 
家 利益 的 考虑 , 意 即 为 了 减少 未 来 贸易 摩擦 的 概率 ,双方 都 在 努力 维持 合作 关系 。 反 之 ， 
这 种 合作 期 待 也 会 使 得 双方 对 未 来 的 收益 赋予 较 高 的 权重 ( 折 现 因子 )。 

尽管 我 们 是 通过 分 析 一 场 具体 博弈 (中 美 贸易 博弈 ) 一 套 具 体 策略 (冷酷 策 略 ) 而 得 
到 的 上 述 结论 ,但 是 维系 合作 关系 的 方案 却 具 有 普遍 适用 性 。 首 先 , 对 于 任意 一 个 博弈 ， 
阶段 博弈 的 纳什 均衡 并 非 都 是 最 佳 的 ( 意 指 不 能 真正 地 使 双方 利益 最 大 化 ,未 达到 帕 累 托 
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最 优 ) 。 对 参与 者 来 说 , 仍 有 其 他 一 系列 行动 作为 选择 以 使 所 有 的 参与 者 保持 合作 。 例 
如 ,在 中 美 贸易 博弈 中 , (贸易 保护 ,贸易 保护 ) 并 非 在 所 有 阶段 都 是 最 佳 的 策略 ,在 某 些 阶 
段 ,双方 参与 者 保持 休战 状态 (贸易 自由 ,贸易 自由 ) 才 是 最 佳 策略 。 其 次 ,无 限 次 重复 博 
弈 及 其 对 应 策略 所 产生 的 收益 让 参与 者 选择 了 真正 意义 上 的 最 佳 策略 。 但 是 请 注意 ,这 
样 的 行动 并 不 会 形成 单一 阶段 博弈 的 纳什 均衡 ,因为 背叛 合作 可 以 获得 更 多 的 短期 收益 。 
现在 ,阻止 违背 协议 的 行动 发 生 的 唯一 方法 就 是 用 较 低 的 未 来 收益 威胁 参与 者 。 而 只 有 
在 参与 者 足够 重视 未 来 收益 时 ,这 种 威胁 才能 生效 。 换 名 话说 ,8 必须 足够 大 。 如 果 6 二 
0, 那 么 参与 者 不 会 关心 未 来 收益 ,只 是 专注 于 当前 收益 。 此 时 他 们 确实 会 违背 协议 ,所 以 
合作 关系 是 不 稳定 的 。 这 一 推测 可 导出 如 下 一 般 结 论 。 

为 了 使 合作 关系 足够 稳定 ,必须 满足 一 些 条 件 。 首 先 ,遭遇 必须 是 重复 的 ,并 且 未 来 
总 有 遭遇 的 可 能 。 其 次 ,参与 者 如 何 行动 必须 具有 可 知性 。 假 设 这 场 博弈 的 历史 是 共同 
知识 , 则 已 经 隐 含 了 这 个 条 件 。 当 且 仅 当 违背 协议 的 行为 是 可 以 被 知晓 的 ,进而 可 以 被 处 
罚 的 ,此 时 惩罚 机 制 才 能 得 以 运行 。 最 后 ,参与 者 必须 足够 关心 未 来 所 发 生 的 事情 及 对 自 
己 收益 的 影响 。 

阶段 性 结论 : 在 不 确定 重复 博弈 或 者 无 限 次 重复 博弈 中 ,未 来 总 有 交手 的 可 能 。 如 
果 参 与 者 足够 关心 他 们 的 未 来 福利 并 且 未 来 也 有 足够 大 的 交手 的 可 能 性 ,那么 此 时 就 可 
能 达到 合作 性 均衡 。 


6.3 信息 不 对 称 下 的 重复 博弈 ” 


上 文 所 讨论 的 重复 博弈 都 是 信息 对 称 的 。 即 使 少数 博弈 中 有 参与 者 不 完全 了 解 得 益 
情况 或 者 无 法 观察 其 他 参与 者 的 某 些 行为 ,但 也 可 以 根据 一 些 决策 解决 问题 。 因 此 可 视 
同 信息 对 称 。 实 际 上 ,人 们 在 现实 决策 活动 中 对 信息 的 掌握 并 不 总 是 那么 充分 与 对 称 。 
购买 商品 时 消费 者 可 能 缺乏 对 商品 质量 的 了 解 ; 在 雇用 员工 时 企业 人 事 经 理 很 难 了 解 应 
聘 者 的 真实 素质 ; 销售 人 寿 保险 时 保险 公司 常 苦于 缺乏 投保 人 健康 情况 的 信息 。 信 息 的 
不 充分 和 不 对 称 通常 会 影响 人 们 进行 判断 与 决策 ,也 会 影响 重复 博弈 中 参与 人 的 策略 。 
对 信息 不 对 称 下 重复 博弈 问题 的 研究 ,除了 博弈 论 研究 本 身 的 需要 以 外 ,也 是 研究 信息 在 
社会 经 济 活动 中 的 作用 价值 。 

从 上 述 两 节 的 分 析 中 读者 不 难 体会 到 ,在 重复 博弈 中 实施 奖励 和 惩罚 能 够 对 参与 者 
的 行动 或 策略 具有 重要 的 影响 ,这 才 使 得 合作 成 为 可 能 。 至 此 你 也 许 已 经 理解 了 黑手 党 
的 成 员 为 何不 愿 背叛 或 告发 同伙 : 一 旦 被 组 织 发 觉 ,他 会 很 难 逃 过 组 织 的 谋杀 ,甚至 他 的 
家 人 也 难 逃 厄运 。 即 使 没有 这 种 界限 明确 的 组 织 存在 ,社会 规范 也 会 对 他 施加 约束 。 文 
明 的 出 现 就 是 这 个 赏罚 机 制 的 确立 ,而 道德 与 国家 则 旨 在 建立 这 样 的 机 制 。 如 果 说 “不 道 
德 ” 行 为 在 一 次 性 博弈 中 广泛 存在 尚且 情 有 可 原 , 若 其 在 重复 博弈 中 广泛 存在 则 是 社会 的 
失范 。 例 如 , 兵 不 厌 诈 与 尔虞我诈 所 带 来 的 社会 意义 大 不 相同 一 尽管 都 是 欺诈 ,但 是 前 
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者 是 陌生 人 之 间 的 一 次 性 对 弈 ,而 后 者 多 发 生 在 伙伴 或 熟人 之 间 的 多 次 交往 中 。 正 如 本 
书 在 其 他 章节 对 利他 、 公 平等 社会 信念 的 论述 ,在 现代 社会 中 ,支撑 社会 规范 存续 的 因素 
有 很 多 种 ,而 作为 新 时 代 的 大 学 生 , 保 有 积极 向 上 、 兼 容 并 包 的 价值 观 是 个 人 未 来 发 展 和 
贡献 社会 的 良好 基石 。 因 此 在 本 书 中 ,我 们 和 暂时 抛 开 对 道德 的 奖惩 作用 的 讨论 ,而 转向 另 
一 种 因素 : 声誉 。 

在 博弈 论 研究 中 ,声誉 效应 被 广泛 采用 以 便 考察 不 完全 信息 下 的 重复 博弈 。 何 以 如 
此 ? 因为 在 不 完全 信息 博 蛮 中 ,参与 者 如 何 通过 信号 向 他 人 传闻 自身 的 合作 取向 (类 型) 
非常 重要 ; 同时 ,奖励 和 惩罚 也 会 累积 形成 某 种 信号 ,用 以 表征 参与 者 的 类 型 ,而 这 个 信 
号 就 是 声誉 。 本 节 将 通过 eBay 和 淘宝 等 C2C( 消 费 者 对 消费 者 ) 信 用 评价 机 制 来 介绍 不 
完全 信息 重复 博弈 中 的 声誉 效应 与 合作 均衡 。 


6.3.1 信息 不 对 称 和 声誉 效应 


如 前 所 述 ,在 信息 完备 的 情况 下 ,有 限 次 重复 博弈 会 产生 连锁 店 悖 论 , 有 限 次 囚徒 困 
境 博 弈 也 有 类 似 的 结果 。 这 表明 ,完全 信息 条 件 下 的 有 限 次 重复 博弈 不 可 能 导致 参与 人 
的 合作 行为 。 在 这 种 情况 下 ,没有 声誉 效应 产生 ,也 不 存在 对 声誉 的 解释 ,因为 参与 人 都 
没有 建立 良好 声誉 的 积极 性 。 声 誉 ,就 是 名 誉 .声望 的 意思 。 在 经 济 学 中 ,关于 声誉 的 最 
常见 概念 是 在 有 关 * 序 列 均衡 ”的 著作 中 所 描述 的 : 

声誉 是 一 种 " 认 知 ”, 即 在 信息 不 对 称 的 条 件 下 ,一方 参 与 人 对 于 另 一 方 参与 人 的 某 种 
类 型 的 认 知 , 且 这 种 认 知 不 断 被 更 新 ,以 包含 两 者 间 的 重复 博弈 所 传递 的 信息 。 

声誉 在 人 类 社会 的 形成 过 程 中 就 这 样 产生 。 在 长 期 的 博弈 过 程 中 ,参与 者 在 信息 的 
交流 过 程 中 逐渐 了 解 彼 此 是 何 种 类 型 的 “ 认 知 ”而 这 种 “ 认 知 ” 正 作 为 一 种 制度 性 知识 协 
调 了 分 工 , 从 而 促进 了 合作 。 此 外 , 它 直 接 或 间接 地 激发 了 参与 者 之 间 的 信任 关系 ,降低 
了 交易 成 本 。 正 如 巴菲特 所 说 :“ 要 赢得 好 的 声誉 需要 20 年 ,而 要 毁 掉 它 ,5 分 钟 就 够 。 
如 果 明 白 了 这 一 点 ,你 做 起 事 来 就 会 不 同 了 。” 

雷 普 斯 等 的 声誉 模型 通过 将 不 完全 信息 引入 有 限 次 重复 博弈 ,解决 了 连锁 店 悖 论 。 

他 们 证 明 , 参 与 人 对 其 他 参与 人 的 不 完全 信息 对 均衡 结果 有 重要 影响 。 只 要 博弈 重复 的 
次 数 足 够 多 ,合作 行为 将 会 在 有 限 次 博弈 中 出 现 。 不 完全 信息 下 的 无 限 次 重复 博弈 也 存 
在 合作 均衡 ,这 一 点 也 在 后 来 被 证 实 。 下 面 我 们 来 看 eBay 和 淘宝 等 C2C 交易 平台 如 何 
通过 信号 传递 机 制 来 显示 卖家 的 声誉 ,并 分 析 声誉 效应 在 重复 博弈 中 的 作用 。 


< 案例 分 析 : eBay 和 淘宝 的 信用 评价 机 制 


美国 eBay 公司 (www. ebay. com) 是 全 球 最 大 的 C2C 交易 网 站 。 它 于 1995 年 9 月 4 
日 由 Pierre Omidyar 以 Auctionweb 的 名 称 创立 于 加 利 福 尼 亚 州 圣 荷 西 。 当 时 Pierre 
Omidyar 的 女 朋 友 酷 爱 Pez 糖果 盒 , 却 为 找 不 到 同道 中 人 交流 而 苦恼 。 于 是 Omidyar 建 
立 起 一 个 拍卖 网 站 ,希望 能 帮助 女 朋友 和 全 美的 Pez 糖果 盒 爱 好 者 交流 。 令 Omidyar 没 
有 想到 的 是 ,拍卖 网 站 非常 受 欢迎 ,很 快 就 被 收集 Pez 糖果 使 、 芭 比 娃娃 等 物品 的 爱好 者 
挤 爆 。1997 年 9 月 网 站 正式 更 名 为 eBay。2003 年 3 月 ,eBay 公司 收购 了 中 国 最 早 的 网 
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上 C2C 交易 网 站 一 一 易趣 ,易趣 也 改名 为 eBay 易趣 (www. ebay. com. cn)。eBay 本 身 并 
不 销售 商品 , 它 只 是 为 买方 和 卖方 提供 一 个 网 上 交易 场所 及 其 他 附带 的 服务 ,并 以 此 作为 
盈利 模式 。 在 节日 期 间 ,eBay 是 全 世界 消费 者 的 购物 圣地 之 一 ,拥有 1.8 亿 全 球 活跃 买 
家 。 仅 2016 年 全 年 ,eBay 的 商业 平台 就 促成 了 数 十 亿 笔 交易 ,商品 交易 总 额 达 到 840 亿 
美元 ,收入 90 亿美 元 。 

淘宝 网 (www. taobao. com) 则 由 阿里 巴巴 公司 于 2003 年 5 月 10 日 投资 创办 。 人 和 凭借 
本 土 化 的 策略 ,淘宝 网 与 eBay 易趣 已 成 为 国内 领先 的 C2C 网 上 交易 平台 。 相 比 易趣 , 淘 
宝 网 的 用 户 社区 更 活跃 , 且 更 早 地 为 买 家 和 卖家 提供 了 即时 通信 工具 。 人 和 凭借 免费 和 本 土 
化 的 策略 ,2005 年 淘宝 网 已 超过 了 易趣 ,成 为 中 国 最 大 的 C2C 网 上 交易 平台 。 堆 至 2014 
年 底 , 淘 宝 网 拥有 注册 会 员 近 5 亿 , 日 活跃 用 户 超 1. 2 亿 , 在 线 商 品 数量 达到 10 亿 , 在 
C2C 市 场 中 ,淘宝 网 占 95.1% 的 市 场 份额 。 

目前 ,网 上 交易 大 多 建立 了 双向 信用 评价 体系 ,提供 一 个 低 成 本 的 信息 收集 、 传 递 的 
平台 。 例 如 ,eBay 和 淘宝 网 上 的 信用 评价 体系 的 基本 原则 是 : 买 家 和 卖家 每 成 功 交 易 一 
笔 , 就 可 以 对 交易 对 象 作 一 次 信用 评价 ,如 图 6-9 所 示 。 就 淘宝 网 来 讲 , 要 求 交 易 完 成 以 
后 ,交易 双方 必须 进行 信用 评价 ,如 果 买 家 或 卖家 (一 般 是 买 家 ) 在 规定 的 时 间 内 没有 进行 
评价 ,系统 自动 地 给 予 对 方 好 评 。 卖 家 认为 买 家 给 予 的 差 评 不 合理 也 可 提交 淘宝 网 仲裁 ， 
避免 了 买 家 以 威胁 给 予 卖家 差 评 来 敲诈 卖家 。 另 外 ,淘宝 网 也 制定 一 些 规则 防止 卖家 用 
不 真实 的 交易 来 炒作 信用 。 总 的 来 说 ,网 上 交易 的 信用 评价 体系 目前 已 比较 成 熟 , 可 以 很 
好 地 衡量 交易 者 的 声誉 。 


宝贝 与 描述 相符 T7 YY VY YY 
店铺 动态 评分 
卖家 的 服务 赤 度 从 信 信人 计 疝 
物流 服务 的 质量 7 5 分 很 满意 
卖家 的 服务 太 梯 了 ， 考 虑 非常 周 
到 ， 完 全 超出 期 望 值 
店铺 名 字 掌柜 档案 
信誉 : 和 多 入 
掌柜 :人 昵 称 昵称 4 伤 和 有 有 系 
联系 ， 才 和 我 民居 雪灾 信用 ，61051 堆 风 内 
卖家 好 评 亨 : 99.73% 
资质 : 轿 区 L000 元 | 买 家 信用 :472 加 
买 家 好 评 率 : 100.0% 
描述 服务 物流 注册 时 间 : 2006 年 05 月 24 日 
4.8 个 4.9 个 4.8 个 Eee 
挑选 更 多 商品 6 | 
进入 掌柜 店铺 


进入 店铺 收藏 店铺 


图 6-9 淘宝 网 某 卖家 的 信用 等 级 和 买 家 的 评价 界面 (2015 年 8 月 18 日 ) 
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给 卖家 的 打分 参考 标准 摘录 如 下 。 
| 0 


5 分 常 满意 。 
满意 的 。 
3 分 量 一 般 ， Mri pg 

2 分 站 人 下 

] 分 满 。 


2. 卖 全 的 服务 才 度 


5 分 周到 ,完全 超出 期 望 值 。 
4 分 入 ,沟通 挺 顺畅 的 ,总体 满意 。 

3 分 

2 分 天 家 有 点 几 不 机 项， 承诺 的 服务 也 沈 现 不 了 


1 分 一 一 卖家 态度 很 差 ,还 骂人 ,说 脏话 ， 简直 不 把 顾客 当 回 事 。 


与 “熟人 社会 " 相 比 ,淘宝 网 是 一 个 “陌生 人 ”社会 。 陌 生 的 交易 双方 信息 是 不 对 称 的 。 
在 交易 过 程 中 卖家 知道 商品 的 质量 状况 ,处 于 信息 优势 的 地 位 ; 而 买 家 只 能 通过 卖家 提 
供 的 商品 图 片 和 文字 介绍 来 了 解 商品 信息 ,对 于 商品 的 质量 只 有 在 交易 完成 后 才 知 道 ,处 
于 信息 劣势 。 具 有 信息 优势 的 卖家 会 有 选择 欺骗 的 机 会 主义 倾向 。 然 而 ,淘宝 并 没有 因 
为 逆向 选择 的 存在 而 变 成 柠檬 市 场 ,反而 在 10 余年 间 成 为 中 国 最 大 的 在 线 交易 网 站 。 是 
什么 机 制 有 效 地 遏制 了 卖家 的 机 会 主义 倾向 ,又 是 什么 机 制 强化 了 * 陌 生 人 "之 间 的 信任 
关系 而 使 买卖 双方 都 成 为 淘宝 的 长 期 客户 呢 ? 


6.3.2 C2C 交易 中 的 声誉 效应 


本 小 节 将 介绍 C2C 交易 平台 中 卖家 的 信用 评价 机 制 。C2C 在 线 交 易 是 一 个 典型 的 
多 人 参与 的 重复 博弈 。 卖 主 掌握 着 不 为 人 所 知 的 私人 信息 (如 他 的 产品 质量 、 忠 诚 度 等 ) 
而 处 于 信息 优势 ,买主 仅 能 根据 卖主 提供 的 图 片 、 介 绍 等 来 了 解 物品 ,处 于 信息 劣势 。 信 
息 不 对 称 影响 着 卖主 (知情 参与 人 ) 的 行动 以 及 买主 (不 知情 参与 人 ) 的 支付 。 一 般 来 讲 ， 
卖主 在 竞拍 结束 并 收 到 付款 信息 后 决定 是 实施 欺骗 还 是 诚信 发 货 ,买主 根据 其 掌握 的 信 
息 决 定 在 竞拍 时 愿意 支付 的 最 高 价格 。 在 这 种 松散 的 网 络 交易 平台 上 ,声誉 效应 (也 即 不 
断 完 善 的 信用 评价 机 制 , 具 体 体现 为 动态 评分 ) 使 得 C2C 交易 蓬勃 壮大 ,交易 日 盛 。 在 
图 6-10 这 个 简单 的 eBay 交易 模型 中 ,读者 可 以 看 到 声誉 效应 是 如 何 发 挥 作用 的 。 

(1) 买主 A 与 卖主 建立 交易 关系 并 进行 交易 。 

(2) 买主 A 根据 交易 的 结果 ,如 产品 品质 .卖主 诚实 的 实施 情况 以 及 买主 的 满意 程度 
等 ,形成 对 于 卖主 是 何 种 类 型 的 认 知 并 对 其 声誉 做 出 评价 。 该 评价 以 信息 的 形式 进入 
eBay 的 声誉 显示 系统 。 

(3) 经 过 eBay 在 线 对 于 信息 的 收集 .聚合 和 整理 ,有 关 卖 主 声誉 的 信息 被 公布 出 来 ， 
该 信息 一 方面 到 达 卖 主 ,使 卖主 获悉 市 场 对 其 声誉 的 评价 ; 另 一 方面 到 达 潜 在 的 交易 群 
体 ,成 为 公共 信息 供 他 们 决策 之 用 。 
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G3) 市 场 评价 


潜在 的 
交易 群体 


(2) 基于 认 知 
对 卖主 进行 
评价 


市 场 中 的 声 
誉 显示 系统 


(1) 买主 A 与 卖主 建立 关系 


图 6-10 eBay 在 线 竞标 中 “声誉 效应 "作用 


我 们 假定 在 C2C 交易 平台 上 存在 一 个 长 期 的 卖主 ,有 无 数 的 短期 买主 在 关注 他 的 
商品 。 

1. 卖主 的 类 型 

卖主 可 能 是 有 机 会 主义 倾向 的 策略 型 ,会 适时 采取 欺骗 战略 来 最 大 化 其 收益 ; 也 可 
能 是 诚实 守信 的 诚信 型 ,永远 都 不 会 欺骗 顾客 。 在 交易 前 买主 虽然 不 清楚 卖主 的 类 型 ,但 
是 他 们 对 于 卖主 是 否 诚信 有 一 个 初始 信念 (概率 分 布 ), 这 就 是 买主 对 卖主 声誉 的 一 种 认 
知 。 关 于 信念 ,请 参考 本 书 第 2、4、5 章 的 相关 内 容 。 如 果 不 存在 信息 反馈 机 制 , 即 买主 过 
去 的 交易 结果 (包括 买主 的 满意 程度 .卖主 的 诚信 程度 等 ) 不 被 交流 ,买主 无 法 获知 关于 卖 
主 类 型 的 信息 ,那么 策略 型 卖主 将 总 是 选择 欺骗 。 这 种 情形 类 似 于 一 次 性 内 徒 困境 博弈 。 
一 旦 短期 的 买主 认识 到 这 一 点 ,将 永远 不 会 选择 购买 。 这 样 ,C2C 交易 平台 将 很 难 存活 。 

2. 买主 的 评价 

简单 起 见 ,假定 信用 评价 机 制 仅 提供 正 、 负 两 类 信息 反馈 , 即 只 有 “好 评 ”" 和 * 差 评 ” 两 
种 。 如 若 卖 主 实施 欺诈 ,他 总 是 得 到 一 个 负 反 馈 ( 买 主 给 予 卖主 一 个 差 评 ) , 若 其 诚信 合 
作 , 他 依然 会 以 概率 x 得 到 负 反 馈 。 这 个 概率 也 被 称 作品 声 。 一 个 特例 就 是 x 二 0, 表 示 
市 场 中 没有 噪声 干扰 ,所 有 诚信 合作 的 卖主 都 会 得 到 好 评 。 

3. 买主 的 信念 

基于 市 场 对 卖主 信息 的 反馈 ,买主 形成 了 关于 卖主 是 诚信 类 型 的 概率 为 h 这 样 一 种 
认 知 (这 就 是 卖主 的 声誉 ) ,以 及 策略 型 卖主 诚信 的 概率 为 ;Ch) 的 认 知 。s(h) 是 关于 卖主 
信誉 的 一 个 函数 。 

至 此 ,我 们 列举 可 能 涉及 的 概率 : 

x: 在 卖家 诚信 的 条 件 下 获得 “ 差 评 ” 的 概率 . 亦 即 噪声 , 记 作 p( 差 评 | 诚信 型 )。 

1 一 x: 在 卖家 诚信 的 条 件 下 获得 “好 评 ” 的 概率 , 记 作 p( 好 评 | 诚 信和 型) 。 

(1 一 z)s(h): 在 卖家 是 策略 型 的 条 件 下 获得 “好 评 ” 的 概率 , 记 作 p (好评 | 策略 型 )， 
等 于 策略 型 卖家 选择 诚信 的 概率 (1) 乘 以 “假扮 ”诚信 后 又 获得 好评” 的 概率 (1 一 x)。 
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1 一 (1 一 x)s(h): 在 卖家 是 策略 型 的 条 件 下 获得 “ 差 评 ”的 概率 , 记 作 p( 差 评 | 策 略 
型 ), 等 于 1 一 p( 好 评 | 策 略 型 )。 

4. 买主 的 策略 

根据 拍卖 理论 ,买主 将 以 其 预期 估价 来 参与 竞价 。[h 十 (1 一 h)s(h)]W 即 为 买主 对 
物品 的 预期 估价 ,其 中 W 是 买主 对 于 物品 的 价值 评估 。 式 中 涉及 卖主 为 诚信 型 时 的 概率 
有 卖家 为 策略 型 且 选 择 诚信 时 的 概率 (1 一 h)s(h)。 注 意 ,卖家 为 策略 型 且 欺 骗 时 的 估价 
为 0( 意 指 如 果 买 家 认识 到 这 一 点 , 则 不 参与 竞价 , 视 同 估价 为 0)。 那 么 ,买主 竞标 的 价格 
将 不 高 于 [h 十 (1 一 h)s(h)]W。 

买主 信念 (或 称 对 卖家 声誉 ) 的 更 新 : 

如 果 在 当前 阶段 卖主 得 到 一 个 负 ( 正 ) 的 评价 ,下 一 个 买主 (或 同一 个 买主 在 下 一 个 阶 
段 ) 就 会 根据 贝 叶 斯 法 则 向 下 (向 上 ) 更 新 他 对 于 卖主 声誉 的 认 知 。 更 新 可 向 两 种 相反 的 


方向 发 生 。 
(1) 向 下 修正 (获得 “ 差 评 ”) ,卖主 声誉 水 平 下 降 : 
jh) p( 差 评 | 诚信 型 )p( 诚 信 型 ) 
p( 差 评 | 诚信 型 )p( 诚 信和 型 ) 十 p( 差 评 | 策略 型 )p( 策 略 型 ) 
mh 


zh 二 [1 (mx)sh)j(l oh) 
(2) 向 上 修正 (获得 “好评”) ,卖主 声誉 水 平 上 升 : 
p( 好 评 | 诚信 型 )p( 诚 信和 型 ) 
p( 好 评 | 诚信 型 )p( 诚 信和 型 ) 十 p( 好 评 | 策略 型 )p( 策 略 型 ) 
= (mh h 
(1—zh+(—x)s(h)(l—h) hi+s(h)(l—h) 


在 概率 理论 中 ,h (4) ,ht+ (1) 分 别 指示 在 " 差 评 " 条 件 下 卖主 诚信 的 概率 和 在 “好 评 ” 
条 件 下 卖主 诚信 的 概率 。 通 俗 地 讲 ,它们 是 在 既 有 评价 的 基础 上 买主 所 形成 的 关于 卖主 
诚信 的 新 信念 (卖家 的 声誉 )。 


总 概念 解读 : 关于 信念 的 更 新 过 程 ,可 通过 下 例 理解 


在 整个 C2C 市 场 中 诚信 型 卖主 的 占 比 会 正 向 地 影响 策略 型 卖主 的 诚信 行为 一 一 诚 
信 型 卖主 越 多 ,策略 型 卖主 选择 诚信 的 比例 也 将 越 高 。 因 此 假设 买 家 的 信念 是 策略 型 卖 
主 选择 诚信 的 概率 与 几 成 正比 关系 。 

阶段 0: 假设 在 当前 的 买主 信念 中 卖主 声誉 为 用 二 0.5, 而 策略 型 卖主 选择 诚信 的 概 
率 为 s( 几 ) 二 0. 5h, 无 噪声 即 x 二 0。 则 诚信 型 卖主 总 是 获得 “好 评 ”, 而 策略 型 卖主 有 25% 
的 可 能 性 通过 选择 诚信 而 获得 "好评 ”, 剩 余 75% 则 获得 “ 差 评 ”"。 此 时 ,在 买主 给 出 差 评 
的 条 件 下 ,卖主 为 诚信 型 的 概率 为 h 二 0。 意 即 获得 " 差 评 ” 的 卖主 总 是 策略 型 的 。 而 在 
买主 给 出 好 评 的 条 件 下 ,卖主 为 诚信 型 的 概率 为 ht 二 0.5/[0.5 十 0.5X0.5X(1 一 0.5)]= 
80%, 而 为 策略 型 的 概率 则 是 20%。 

阶段 1: 新 卖主 将 会 依据 评价 更 新 自己 的 信念 。 

(1) 当 买 主 遇 到 被 差 评 的 卖主 时 , 则 更 新 自己 对 卖主 的 信念 用 :二 hh 二 0。 同 时 类 似 


ht (h) 
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阶段 0, 买主 给 出 当前 阶段 的 评价 , 即 新 的 二 0 和 有 ht 一 0。 此 时 买主 认为 ,不 仅 差 评 条 
件 下 卖主 诚信 的 概率 是 0, 而 且 连 好 评 下 卖主 诚信 的 概率 也 变 成 0 了 。 因 此 , 当 买 主 遇 到 
声誉 低 的 卖主 时 ,将 降低 自己 对 卖家 诚信 的 信念 ,也 更 易 给 出 差 评 。 例 如 ,现在 , 买 家 就 会 
认为 市 场 中 没有 诚信 的 卖家 。 

(2) 当 买 主 遇 到 被 好 评 的 卖主 时 , 则 更 新 自己 对 卖主 的 信念 :二 ht 二 0.8。 同 时 类 
似 阶 段 0, 买 主 给 出 当前 阶段 的 评价 , 即 新 的 h 二 0 和 ht 二 0.909。 可 见 , 买 主 给 出 差 评 
时 为 诚信 型 卖主 的 概率 依然 是 0, 但 买主 给 出 好 评 时 诚信 型 卖主 的 概率 则 上 升 到 了 
0.909。 因 此 ,获得 好 评 的 卖主 在 买主 中 的 声誉 会 越 来 越 高 ,这 也 会 提高 新 买主 对 自己 诚 
信 的 信念 。 

在 接 下 来 的 阶段 中 ,更 新 将 如 此 往复 。 

如 果 市 场 中 存在 噪声 , 即 x 隆 0, 买 家 的 信念 稍 显 复杂 。 此 时 获得 “ 差 评 ” 的 卖主 既 有 
可 能 被 认为 是 策略 型 的 ,又 有 可 能 被 当 作 诚 信 型 不 再 像 无 噪声 时 那么 简单 ,，“ 差 评 ” 就 
一 定 被 认为 是 策略 型 的 。 当 然 , 获 得 “好 评 ” 的 卖主 情况 不 变 , 仍 然 是 两 种 类 型 的 混杂 。 读 
者 可 尝试 推导 。 


如 此 一 来 ,获得 "好评 ”的 卖主 的 声誉 就 会 越 来 越 高 ,从 而 聚集 越 来 越 多 的 买主 ; 而 欺 
骗 顾 客 的 卖主 将 获得 越 来 越 多 的 “ 差 评 ”, 声 誉 也 越 来 越 低 , 逐 渐 退 出 市 场 。 不 过 ,卖主 是 
不 会 轻易 退出 市 场 的。 对 于 策略 型 卖主 ,还 有 选择 可 使 他 存留 : 转变 自己 的 策略 ,诚信 交 
易 。 准 确 来 讲 , 即 降低 欺骗 的 次 数 ,提高 诚信 交易 的 频率 。 即 使 你 对 细节 尚未 知晓 ,也 许 
仍然 能 够 接受 这 样 的 事实 : 卖主 策略 是 随 着 买主 的 信念 而 进行 更 新 的 , 即 卖主 的 最 优 反 
应 s* 依赖 于 h。 那 么 ,卖主 的 策略 又 是 什么 ”如 何 更 新 呢 ? 

5. 卖主 的 策略 

在 每 次 竞标 交易 结束 之 后 ,一 旦 卖主 看 到 买方 的 付款 信息 ,他 将 必须 在 “欺骗 "与 * 诚 
信 ? 这 两 种 行动 中 做 出 选择 。“ 欺 骗 ” 的 短期 利得 等 于 该 商品 的 价值 ,但 是 声誉 评级 的 降低 
将 带 来 长 期 的 损失 ,因为 买主 愿意 支付 的 价格 会 降低 (对 于 固定 价格 商品 ,相当 于 交易 数 
量 将 减少 ) 。 如 前 所 述 ,我 们 关注 的 是 策略 型 卖主 选择 诚信 的 可 能 性 。 因 此 ,考虑 这 样 一 
种 策略 : 策略 型 卖主 以 某 一 概率 水 平 s(h) 选 择 诚信 。 对 于 某 一 固定 的 策略 型 卖主 来 讲 ， 
可 以 简单 地 将 该 策略 理解 为 多 次 交易 中 选择 诚信 的 频率 ; 而 从 卖主 整个 群体 来 讲 , 则 相 
当 于 策略 型 卖主 中 有 多 大 比例 的 人 表现 得 诚信 而 非 欺 骗 。 当 然 , 得 益 函 数 是 卖主 所 有 阶 
段 得 益 的 现 值 之 和 。 买 主 知道 ,在 均衡 中 卖主 的 策略 必定 是 与 卖主 的 最 优 反应 相 一 致 的 。 


那么 ,卖主 的 目标 是 实现 其 预期 得 益 的 最 大 化 , 即 V = >)6G (4,) ,其 中 hh 表示 第 1 
t 一 0 


阶段 卖主 的 声誉 ,G(h) = [hi 十 (1 一 hi)s(hi)]JW 则 表示 第 t 阶段 卖主 的 期 望 收入 。 

在 这 样 一 个 博弈 中 ,要 通俗 地 展示 买卖 双方 的 均衡 及 其 存在 条 件 . 需 要 做 很 多 理论 铺 
垫 。 考 虑 到 本 书 的 定位 ,我 们 不 再 展开 。 假 设 均 衡 已 经 知晓 ,让 我 们 来 分 析 一 下 它 如 何 受 
外 界 条 件 的 影响 ,也 许 这 会 是 一 个 有 趣 的 话题 。 

如 果 不 存在 噪声 (r=0) 且 每 笔 交易 的 利润 率 都 足够 高 ,那么 一 个 卖主 得 到 的 哪怕 只 
是 一 次 的 负面 评价 ,也 不 再 会 有 买主 从 他 那里 购买 商品 ; 只 要 剩余 的 时 间 足 够 长 ,没有 负 
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面 评 价 记 录 的 卖主 总 会 选择 “合作 ”, 而 买主 也 通过 支付 完全 信息 条 件 ( 不 存在 噪声 ) 下 的 
价格 以 激励 他 们 这 样 做 。 随 着 博弈 结束 点 的 到 来 (如 卖主 注销 在 线 交 易 账 号 结束 在 eBay 
的 拍卖 生涯 ) ,卖主 开始 不 在 乎 他 们 的 声誉 并 且 会 增加 欺骗 的 可 能 性 ,通常 卖主 在 博弈 的 
最 后 一 个 阶段 总 是 会 采取 “欺骗 "行动 ,这 就 是 通常 所 谓 的 声誉 的 “终止 博弈 效应 ”。 

如 果 存 在 噪声 (x 二 0), 品 声 评价 将 对 博弈 结果 产生 重要 影响 。 即 使 噪声 是 少量 的 
〈 意 即 诚信 交易 却 被 给 予 负面 评价 的 概率 非常 小 ) ,也 没有 一 个 “策略 型 "卖主 会 认为 最 优 
的 战略 是 100% 的 诚信 ,因此 博弈 均衡 的 结果 是 混合 的 ,有 “欺骗 ”, 也 有 “诚信 ”。 买 主 预 
期 到 卖主 会 这 样 做 ,因此 他 们 愿意 支付 的 价格 低 于 信息 完全 时 的 价格 。 当 然 , 卖 主 也 会 意 
识 到 这 个 问题 ,因此 ,策略 型 卖主 表现 出 “诚信 ”的 概率 s(h) 受 卖主 的 声誉 和 噪声 量 的 
影响 。 

图 6-11 显示 的 是 在 噪声 (x 二 0.05) 、 利 润 率 为 50% 以 及 折 现 因子 为 0.99 的 情况 下 卖 
主 的 声誉 与 诚信 概率 以 及 买主 支付 的 “相对 价格 ”的 关系 曲线 图 了 ?。 从 图 中 可 以 看 出 , 卖 
主 声誉 水 平 越 高 ,诚信 的 概率 越 大 ,买主 实际 支付 的 价格 与 买主 的 估计 越 接近 。 但 是 请 注 
意 , 当 声誉 非常 高 时 策略 型 卖主 诚信 的 概率 却 急剧 下 降 。 这 正 是 上 文 所 述 ,噪声 的 存在 使 
得 卖主 不 可 能 采取 100% 诚 信 的 策略 , 当 辛 苗 伪装 获得 的 声誉 终于 可 以 高 位 套现 ,“ 爱 惜 
羽毛 ?的 卖主 便 会 露出 真面目 。 实 际 上 ,噪声 的 存在 将 会 导致 交易 效率 的 损失 。 
和 对价 桥 比 


， 


SRC 
一 5. [= [= 一 3 b=] 己 
s Ss > a Ss S Ss Ss Ss 
声誉 


图 6-11 卖主 声誉 对 诚信 概率 和 相对 价格 的 影响 


至 此 ,总 结 一 下 本 节 的 内 容 。 信 息 不 对 称 是 一 种 普遍 的 经 济 状 态 ,声誉 效应 有 效 地 抑 
止 了 信息 优势 参与 人 的 机 会 主义 倾向 ,从 而 成 功 地 引导 出 了 较 高 水 平 的 诚信 行为 。 在 噪 
声 环境 中 ,即使 声誉 发 挥 作用 ,也 总 是 存在 一 定 的 效率 损失 。 声 誉 效应 作用 的 前 提 是 利润 
率 足 够 大 。 在 长 期 博弈 过 程 中 , 当 长 期 诚信 的 损失 超过 短期 机 会 主义 行为 的 收益 时 ,欺骗 


@ 相对 价格 一 买主 实际 支付 的 价格 /完全 信息 条 件 下 买主 对 商品 的 估价 -。 
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就 会 发 生 。 在 有 限 博弈 的 最 后 阶段 ,声誉 机 制 有 可 能 会 失效 
期 以 来 建立 的 声誉 。 


2 扩展 阅读 : 奥 曼 与 重复 博弈 


2005 年 10 月 11 日 ,瑞典 皇家 科学 院 宣布 将 本 年 度 的 诺 贝 尔 经 济 学 奖 授 予以 色 列 希 
伯 莱 大 学 的 罗伯特 ， 奥 曼 和 美国 马里 兰 大 学 的 托马斯 * 谢 林 ,以 表彰 他 们 通过 博弈 论 分 
析 对 理解 冲突 与 合作 所 做 出 的 贡献 。 奥 曼 最 重要 的 贡献 是 对 重复 博弈 、 非 合作 博弈 理论 
的 发 展 。 根 据 瑞 典 皇 家 科学 院 的 官方 文件 , 奥 曼 此 次 获得 诺 贝 尔 经 济 学 奖 的 主要 原因 是 
他 对 重复 博弈 的 贡献 。 

奥 曼 1930 年 出 生 于 法 兰 克 福 , 具 有 以 色 列 和 美国 双重 国籍 。 他 1950 年 毕业 于 纽约 
大 学 并 获 数学 学 士 学 位 ; 之 后 又 于 1952 年 和 1955 年 在 麻 省 理工 学 院 攻 读 代数 拓扑 学 ， 
先后 获得 数学 硕士 和 博士 学 位 ; 1956 年 至 今 受 聘 于 耶路撒冷 希 伯 莱 大 学 数学 研究 院 。 
在 麻 省 理工 学 院 深造 期 间 , 奥 曼 遇 到 了 纳什 ,并 从 纳什 那里 听 说 了 博弈 论 。 从 麻 省 理工 学 
院 毕 业 后 , 奥 曼 在 普林斯顿 大 学 数学 系 附 属 运筹 学 小 组 做 博士 后 研究 ,其 研究 项 目 来 自由 
尔 实验 室 主 持 的 防御 导弹 研究 。 当 时 ,运筹 学 与 博弈 论 已 经 关系 密切 ,在 接触 了 贝尔 实验 
室 的 导弹 防御 研究 项 目 以 后 , 奥 曼 发 现 这 些 问题 和 纳什 所 说 的 博弈 论 有 点 儿 相 像 ,并 开始 
从 博弈 论 的 角度 研究 问题 ,并 在 这 个 时 期 对 博弈 论 产 生 了 浓厚 的 兴趣 。1959 年 , 奥 曼 发 
表 了 第 一 篇 有 关 重 复 博弈 的 论文 。 

奥 曼 第 一 次 全 面 而 且 正 式 地 分 析 了 所 谓 的 无 限 次 重复 博弈 ,并 且 揭 示 了 在 长 期 关系 
下 最 终 能 得 到 的 结果 。 奥 曼 关于 重复 博弈 的 贡献 可 简单 归纳 如 下 。 

首先 ,是 对 完全 信息 重复 博弈 研究 的 推进 。 完 全 信息 博弈 的 最 早 研究 成 果 出 现在 20 
世纪 50 年代 , 即 下 文 将 出 现 的 “民间 定理 ”。 该 定理 认为 ,重复 博弈 的 策略 均衡 结局 与 一 
次 性 博弈 中 的 可 行 个 体 理 性 结局 恰好 相 一 致 。 这 个 结局 可 被 视 为 把 多 阶段 非 合作 行为 与 
一 次 性 博弈 合作 行为 联系 在 一 起 。 然 而 ,虽然 所 有 可 行 的 个 体 理性 结局 确实 代表 了 有 关 
合作 博弈 解 的 观点 ,但 是 它 相 当 模 糊 , 并 且 不 提供 信息 。 而 奥 曼 认为 ,完全 信息 重复 博弈 
论 与 人 们 相互 作用 基本 形式 的 演化 相关 。 它 的 目的 是 解释 诸如 合作 、 利 他 、 报 复 、 威 胁 ( 自 
我 破坏 或 其 他 ) 等 现象 。 奥 曼 还 考察 了 许多 具体 的 合作 行为 ,定义 了 “ 强 均衡 "概念 , 即 没 
有 任何 局 中 人 团体 可 以 通过 单方 面 改变 他 们 决策 来 获 益 的 情形 。 为 此 , 奥 曼 定 义 和 研 究 
了 经 济 理论 中 极为 重要 的 “一 般 ” 合 作 博 弈 , 即 不 可 转移 效用 (non-transferable utility) 博 
弈 ,从 而 开拓 了 该 领域 的 研究 空间 。 

其 次 ,是 对 不 完全 信息 重复 博弈 研究 的 推进 。 从 20 世纪 60 年 代 中 期 开始 , 奥 曼 和 其 
他 合作 者 一 起 发 展 了 不 完全 信息 重复 博弈 论 。1966 年 , 奥 曼 和 迈克 尔 ， 马 希 勒 在 给 美国 
武器 控制 和 裁军 机 构 的 开创 性 报告 中 ,建立 了 不 完全 信息 重复 博弈 模型 。 他 们 指出 ,信息 
使 用 的 复杂 性 实际 上 可 以 以 一 种 出 色 明 确 的 方式 来 解决 。 例 如 ,在 最 简单 的 两 人 零 和 重 
复 博弈 中 ,其 中 一 个 局 中 人 比 另 一 个 局 中 人 拥有 更 多 的 信息 (这 就 是 所 谓 的 单 边 不 完全 信 
息 ) 。 拥 有 更 多 信息 的 局 中 人 所 使 用 (并 披露 ) 的 信息 量 是 精确 决定 的 : 有 时 是 完全 披露 
或 根本 没有 披露 ; 而 有 时 则 是 部 分 披露 。 这 种 分 析 被 扩展 至 更 一 般 的 模型 ,并 由 此 产生 


参与 者 可 能 不 异 毁 损 长 
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许多 精深 的 新 观点 和 概念 。 之 后 , 奥 曼 在 重复 博弈 方面 的 研究 获得 了 丰硕 的 成 果 。 事 实 
上 ,他 的 有 关 不 完全 信息 博弈 的 许多 重要 观点 已 被 应 用 于 许多 经 济 领 域 ,诸如 赛 头 垄断 、 
委托 一 代理 关系 和 保险 等 。 


6.4 重复 博弈 的 进一步 讨论 


6.4.1 纳什 均衡 不 唯一 的 重复 博弈 


1. 如 果 阶 段 博弈 中 有 多 个 纯 策 略 纳什 均衡 

设 某 一 市 场 有 两 个 生产 同样 质量 产品 的 厂商 ,它们 对 产品 的 定价 同时 有 高 (CH) .中 
(MD \ 低 (L) 三 种 可 能 。 设 高 价 时 市 场 总 利润 为 10 个 单位 ,中 价 时 市 场 总 利润 为 6 个 单 
位 , 低 价 时 市 场 总 利润 为 2 个 单位 。 再 假设 两 厂商 同时 决定 价格 ,价格 不 等 时 低 价格 者 独 
享 利润 ,价格 相等 时 双方 平分 利润 。 这 时 候 两 厂 厂商 2 
商 对 价格 的 选择 就 构成 了 一 个 静态 博弈 问题 ,如 和 新 
图 6-12 所 示 。 我 们 看 一 个 三 价 博 弈 的 重复 博弈 
的 例子 。 

显然 ,这 个 得 益 和 矩阵 有 两 个 纯 策 略 纳什 均衡 
(M,M) 和 (L,L), 可 以 看 出 ,实际 上 两 参与 者 最 
大 的 得 益 是 策略 组 合 (H,H) ,但 是 它 并 不 是 纳什 图 6-12 三 价 博弈 的 重复 博弈 
均衡 。 现 在 考虑 重复 两 次 该 博弈 ,我 们 采用 一 种 
触发 策略 : 博弈 双方 首先 试图 合作 ,一 旦 发 觉 对 方 不 合作 也 用 不 合作 相 报复 的 策略 。 使 
得 在 第 一 阶段 采用 (H, H) 成 为 子 博弈 完美 纳什 均衡 ,其 双方 的 策略 是 这 样 的 ， 

(1) 参与 者 1: 第 一 次 选 H; 如 果 第 一 次 结果 为 (H,H), 则 第 二 次 选 M, 如 果 第 一 次 
结果 为 任何 其 他 策略 组 合 , 则 第 二 次 选择 L。 

(2) 参与 者 2: 同 参与 者 1。 

在 上 述 双方 策略 组 合 下 ,两 次 重复 博弈 的 路 径 一 定 为 第 一 阶段 (H,H) ,第 二 阶段 
(M,M) ,这 是 一 个 子 博弈 完美 纳什 均衡 路 径 。 因 为 第 二 阶段 是 一 个 原 博 弈 的 纳什 均衡 ， 
因此 不 可 能 有 哪 一 方 愿意 单独 偏离 ; 其 次 ,第 一 阶段 的 (H,.H) 虽 然 不 是 原来 的 博弈 纳什 
均衡 ,但 是 如 果 一 方 单独 偏离 ,采用 M 能 增加 1 单位 得 益 ,这 样 的 后 果 却 是 第 二 阶段 至 少 
要 损失 2 单位 的 得 益 , 因 为 双方 采用 的 是 触发 策略 , 即 有 报复 机 制 的 策略 ,因此 合理 的 选 
择 是 坚持 H。 这 就 说 明了 上 述 策略 组 合 是 这 个 两 次 重复 博弈 的 子 博弈 完美 纳什 均衡 。 

从 上 述 的 例子 我 们 可 以 看 出 ,有 多 个 纯 策 略 纳什 均衡 的 博弈 重复 两 次 的 子 博弈 完美 
纳什 均衡 路 径 是 ,第 一 阶段 采用 (CH,H) .第 二 阶段 采用 原 博弈 的 纳什 均衡 C(M,M) 。 

如 果 这 个 重复 博弈 重复 三 次 ,或 者 更 多 次 ,结论 也 是 相似 的 ,仍然 用 触发 策略 , 它 的 子 
博弈 完美 纳什 均衡 路 径 为 除了 最 后 一 次 以 外 ,每 次 都 采用 (H,H) ,最 后 一 次 采用 原 博 弈 
的 纳什 均衡 (M,M)。 

阶段 性 结论 : 当 阶 段 博弈 G 有 多 个 纯 策 略 纳什 均衡 时 ,有 限 次 重复 博弈 G' 有 许多 效 
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率 差 异 很 大 的 子 博弈 完美 纳什 均衡 。 进 而 ,可 以 通过 设计 特定 的 策略 (主要 是 包含 报复 机 
制 的 触发 策略 ) 来 实现 效率 更 高 的 均衡 ,充分 发 气 一 次 性 博弈 中 无 法 实现 的 潜在 合作 利 
益 。 但 是 ,在 有 限 次 重复 博弈 中 ,博弈 双方 没有 永远 的 合作 。 

综合 第 6. 2. 3 节 的 阶段 性 结论 ,可 得 下 述 有 限 次 重复 博弈 民间 定理 。 

有 限 次 重复 博弈 民间 定理 (Folk Theorem,Frideman,1971): 假设 在 有 限 次 重复 博弈 
G' 中 ,阶段 博弈 G 存在 一 个 均衡 得 益 组 合 优 于 最 差 均衡 所 对 应 的 得 益 组 合 , 则 对 于 所 有 
不 小 于 “个 体 理 性 得 益 ”( 或 称 “保留 得 益 ”) 的 “可 实现 得 益 ”, 都 至 少 存在 一 个 子 博弈 完美 
纳什 均衡 来 实现 它 。 


( 科 Wi 他 角 这 ;对 定 弄 | 名 加 的 法 易 角 和 


在 某 个 博弈 中 ,不 管 其 他 参与 者 的 行为 如 何 , 参 与 者 只 要 采取 某 种 策略 能 够 最 低 限度 
保证 能 获得 的 得 益 称 为 “个 体 理性 得 益 ”; 而 博弈 中 所 有 纯 策 略 组 合 所 对 应 的 得 益 组 合 的 
加 权 平 均 ( 权 数 非 负 上 且 总 和 为 1) 称 为 "可 实现 得 益 ”, 意 即 参 与 者 采用 任意 混合 策略 所 能 
实现 的 得 益 组 合 。 在 有 限 次 重复 博弈 中 ,针对 阶段 博弈 存在 多 个 纯 策 略 纳什 均衡 的 民间 
定理 ,在 无 限 次 重复 博弈 中 对 阶段 博弈 存在 唯一 纳什 均衡 的 情况 也 是 成 立 的 。 为 什么 会 
被 称 为 “民间 定理 " 呢 ? 这 是 因为 在 有 人 正式 证 明 并 发 表 之 前 , 它 已 经 在 “民间 ”流传 。 


关于 定理 所 声明 的 结论 ,让 我 们 举例 说 明 。 来 看 一 下 《史记 ， 廉 颇 获 相 如 列传 ) 中 “将 
相 和 ”的 故事 。 

战国 时 赵 国 使 人 葡 相 如 奉命 出 使 敌国 ,不 怀 使 命 , 完 壁 归 赵 ,所 以 被 封 了 上 大 夫 ; 又 
陪同 赵 王 赴 秦 王 设 下 的 光 池 会 ,使 赵 王 免 受 秦王 侮 硬 。 赵 王 为 表彰 兽 相 如 的 功劳 , 封 葡 相 
如 为 上 卿 。 老 将 廉 颇 认为 自己 战 无 不 胜 , 攻 无 不 克 , 兽 相 如 只 不 过 是 一 介 文 弱 书 生 , 只 
口 震 之 功 却 比 他 官 大 ,对 此 心中 很 是 不 服 , 所 以 屡次 对 人 说 :“ 以 后 让 我 见 了 他 ,必定 会 姜 
面 他 。” 效 相 如 知道 此 事后 以 国家 大 事 为 重 ,请 病假 不 上 朝 , 尽 量 不 与 他 相 见 。 后 来 廉 颇 得 
知 菌 相 如 此 举 完 全 是 以 国家 大 事 为 重 ,向 菌 相 如 负 齐 请 罪 。 之 后 两 人 和 好 开始 尽心 尽力 
地 辅 估 赵 王 治 理 国 家 。 


在 上 述 互动 中 ,二 者 都 有 两 种 行动 可 选择 : 羞辱 对 商 相 如 
方 ,宽容 忍让 。 假 如 二 者 的 静态 博弈 矩阵 可 用 图 6-13 羞 层 。 宽容 
表示 。 i 强 | oo | 41 | 
可 见 , 两 个 参与 者 最 差 的 均衡 得 益 都 是 1, 则 可 宽容 


构成 得 益 组 合 w= 二 (1,1) ,而 1 也 是 两 个 参与 者 的 “个 图 6.13 廉 颇 . 菌 相 如 博 座 

体 理 性 得 益 ”。 如 图 6-14 所 示 , 该 博弈 的 可 实现 得 益 

就 是 图 中 4 点 (0,0),(1,4),(4,1),(3.3) 所 围 成 的 阴影 区 域 B 中 点 的 坐标 。 显 然 , 我 们 
可 以 看 到 该 博弈 的 一 次 性 博弈 中 存在 均衡 得 益 数组 优 于 蒂 : 满 足 民间 定理 的 条 件 。 因 此 ， 
所 有 不 小 于 个 体 理 性 得 益 的 可 实现 得 益 [ 由 4 点 (1.1).(1.4).,(4,1),(3,3) 所 围 成 阴影 区 
域 A 中 点 的 坐标 ], 都 有 子 博弈 完美 纳什 均衡 来 实现 它 。 例 如 .(4.1) 和 (1,4) 可 每 次 采用 
原 博弈 同一 个 纳什 均衡 的 子 博弈 完美 纳什 均衡 实现 ; 这 两 点 连 线 上 的 点 用 原 博弈 两 个 纯 
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策略 纳什 均衡 的 某 种 组 合 来 实现 。 
苦 相 如 得 益 直 


(1.4) 


0 康 虎 得 基 
图 6-14 ”两 市 场 博弈 有 限 次 重复 的 民间 定理 


事实 上 ,在 所 有 可 实现 或 优 于 w= (1.1) 的 可 实现 得 益 中 ,只 有 处 于 (1,4) 与 (3,3), 以 
及 (3,3) 与 (4,1) 这 两 条 连 线 上 的 可 实现 得 益 具 有 重要 意义 ,因为 它们 是 帕 累 托 最 优 的 均 
衡 得 益 。 而 民间 定理 的 重要 意义 正在 于 证 明了 一 定 存在 子 博弈 完美 纳什 均衡 可 以 实现 或 
允 近 它们 。 可 见 , 民 间 定 理 为 我 们 设计 更 有 效率 的 机 制 提 供 了 参照 ,也 为 参与 者 在 博弈 过 
程 中 的 默契 和 信任 提供 了 理性 支撑 。 

2. 如 果 阶 段 博弈 是 零 和 博弈 独 硬 币 方 

让 我 们 来 看 经 典 的 猜 硬币 博弈 ,如 图 6-15 所 示 。 正面 反面 

eae cng dee , 零 和 博 计 是 严格 竞争 EW .| "| 
的 。 即 使 重 也 不 能 改变 这 一 点 。 关 键 在 于 ， ”反面 
严格 对 立 的 利益 关系 使 得 双方 矛盾 不 可 调和 ,重复 的 芽 二 下 有 项 
零 和 博弈 也 不 会 创造 出 新 的 利益 来 。 以 零 和 博弈 为 图 6-15 猜 帘 币 博 奔 
原 博 弈 的 有 限 次 重复 博弈 与 猜 硬币 博弈 的 有 限 次 重 
复 博 弈 一 样 ,参与 者 的 正确 策略 是 重复 一 次 性 博弈 中 的 混合 纳什 均衡 。 读 者 可 以 按照 前 
面 例子 中 的 讲解 ,使 用 逆向 归纳 法 来 证 明 。 同 样 地 ,无限 次 重复 的 两 人 截 和 博弈 的 所 有 阶 
段 都 不 可 能 发 生 合作 ,参与 者 会 一 直 重 复 阶 段 博弈 的 混合 纳什 均衡 。 这 一 点 与 前 文 无 限 
重复 博弈 的 相关 结论 不 一 致 。 以 上 结论 可 以 推广 到 常 和 博弈 .及 至 有 多 个 参与 者 的 常 和 
博弈 。 


6.4.2 重复 博弈 的 实验 结果 


在 无 限 重复 博弈 中 ,为 了 提高 博弈 效率 和 博弈 潜在 的 利益 ,参与 者 经 常会 采取 合作 的 
方式 来 获得 最 大 程度 的 利益 。 但 是 在 合作 过 程 中 ,合作 的 方式 和 水 平 总 是 会 因为 各 种 各 
样 因素 发 生变 化 。 本 节 通 过 介绍 类 似 内 徒 困境 的 实验 来 展示 合作 博弈 的 过 程 以 及 合作 均 
衡 的 条 件 。Dal Be 通过 实验 比较 了 具有 相同 期 望 次 数 的 无 限 重复 和 有 限 重 复 内 徒 困境 ， 
发 现 无 限 重复 内 徒 困 境 中 合作 水 平 会 更 高 一 些 。 这 点 与 理论 预测 一 致 。 同 时 ,实验 表明 
重复 博弈 的 次 数 对 合作 的 影响 是 很 小 的 ,但 是 有限” 和 “无 限 " 仍 有 区 别 。 我 们 将 重点 介 


(4,1) 
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绍 无 限 重复 博弈 下 的 实验 结果 。 
Dal B6 和 Frechette(2011) 在 前 人 研究 的 基础 上 ,展开 了 一 系列 实验 研究 。 首 先 ,在 
试验 中 重复 博弈 是 随机 停止 的 。 在 每 一 阶段 结束 后 ,博弈 持续 的 概率 分 别 为 0. 5 和 0. 75。 
同时 ,图 6-16 中 的 合作 收益 R 分 别 为 32,40 和 48。 将 不 同 的 持续 概率 与 不 同 的 合作 收 
益 进行 组 合 ,可 将 博弈 实验 分 为 6 组。 随机 停止 的 概 因 徒 四 
率 和 合作 收益 大 小 对 有 经 验 的 参与 者 来 说 非常 重要 ， 台 作 。 。” 硼 版 
但 对 无 经 验 者 来 说 似乎 不 太 明 显 , 这 点 已 为 实验 所 证 
实 。 在 这 6 组 实验 中 ,有 1 组 中 合作 不 在 均衡 路 径 上 ， 四 伟人 ， 
另 5 组 都 存在 多 个 合作 均衡 。 无 论 均衡 如 何 , 永 远 背 
叛 总 是 最 有 可 能 被 采取 的 一 个 策略 。 共 有 纽约 大 学 的 “图 6-16 囚徒 困境 实验 的 支付 矩阵 
266 名 研究 生 志愿 者 参与 了 实验 。 在 持续 概率 与 合作 
收益 给 定 的 条 件 下 ,志愿 者 参加 阶段 数 在 23 一 77 的 无 限 重 复 博弈 。Dal B6 和 Fréchette 
据 此 研究 在 参与 人 获得 一 次 次 的 经 验 时 是 如 何 达成 合作 的 。 有 三 点 发 现 意义 非凡 , 耐 人 
寻味 。 

首先 ,如 果 合作 根本 不 是 博弈 的 均衡 ,合作 水 平 9 将 随 着 经 验 的 增加 而 递减 并 收 笋 到 
较 低 的 水 平 。 这 点 与 一 次 性 重复 博弈 的 实验 结果 类 似 。 这 也 说 明 , 若 想 让 合作 发 生 并 随 
着 经 验 而 递增 ,首要 的 条 件 是 它 的 确 是 一 个 均衡 。 

其 次 ,在 某 些 组 实验 中 合作 的 确 是 均衡 ,但 令 人 意外 的 是 ,合作 水 平 也 不 一 定 升 高 ,而 
依然 停留 在 较 低 水 平一 一 即使 参与 人 已 经 获得 了 重要 的 经 验 。 它 表明 ,参与 人 可 能 没有 
充分 利用 合作 。 同 时 也 表明 ,“ 成 为 均衡 "只 是 合作 随 经 验 而 提升 的 一 个 必要 条 件 , 而 非 充 
分 条 件 。 

最 后 ,如 果 合作 是 博弈 的 均衡 且 是 风险 占 优 的 ,合作 的 平均 水 平 会 随 经 验 而 提升 ,但 
并 不 总 是 如 此 。 在 一 次 性 协调 博弈 中 ,参与 人 常常 选择 兼 具 帕 累 托 最 优 和 风险 占 优 的 行 
动 。 但 在 无 限 重复 博弈 中 ,这 两 项 对 于 提升 合作 水 平 仍然 不 够 。 因 此 ,如 果 有 人 说 “只 要 
有 机 会 ,就 应 充分 利用 它 来 达成 合作 ”, 请 不 要 过 于 乐观 一 一 因为 达成 合作 是 件 困 难 的 事 
情 ,即便 当事人 经 验 丰富 。 值 得 注意 的 是 ,在 无 限 重复 博弈 中 既 有 合作 水 平 较 低 的 ,也 有 
合作 水 平 非常 之 高 的 情况 发 生 。 尽 管 “成 为 均衡 "和 “风险 占 优 ”都 不 是 经 验 促 生 合作 的 充 
分 条 件 , 但 是 在 条 件 适 合 时 合作 确实 能 够 达到 很 高 的 水 平 。 仅 从 平均 意义 上 讲 , 若 满足 
“成 为 均衡 " 且 “ 风 险 占 优 ”, 则 合作 水 平 会 随 参与 者 经 验 的 增加 而 提升 。 


6.4.3 应 对 背叛 的 策略 

重复 博弈 之 所 以 能 够 有 改变 原 纳什 均衡 的 可 能 性 ,在 于 它 使 “双边 惩罚 机 制 ? 发 生 作 
用 。“ 双 边 人 惩罚 机 制 " 是 指 一 旦 发 现 对 方 背 叛 . 参 与 者 将 采用 “触发 策略 ”或 “针锋相对 ” 策 
略 , 即 当 背 叛 的 行为 发 生 之 时 ,交易 双方 将 启用 这 种 机 制 来 惩罚 背叛 者 .“ 双 边 惩罚 机 制 ” 
是 最 为 基本 的 信用 机 制 。 它 是 要 保证 两 个 个 体 在 互动 过 程 中 互 不 欺骗 ,保证 博弈 的 顺利 


@ 用 “合作 ”行动 发 生 的 频率 来 指示 。 
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进行 ,是 建立 信用 的 关键 与 基础 。 博 弈 的 可 否 持续 性 被 认为 是 "双边 惩罚 机 制 的 主要 基 
础 。 在 一 次 性 博弈 中 ,任何 参与 者 都 没有 信守 承诺 的 激励 。 只 有 当 博 弈 双方 的 当前 博弈 
是 未 来 互动 的 一 个 组 成 部 分 时 ,双方 才 有 可 能 采取 相互 合作 的 态度 。 

在 动态 的 博弈 中 ,所 有 参与 者 的 历史 行动 都 是 可 观测 的 。 参 与 者 可 以 通过 在 下 一 阶 
段 博弈 中 的 策略 选择 一 一 触发 策略 或 针锋相对 策略 ,进而 通过 “双边 惩罚 机 制 ? 来 回应 其 
他 参与 人 在 本 阶段 中 的 行动 , 依 此 实现 对 对 手 失 信 的 惩罚 。 我 们 假定 在 每 一 次 博弈 结束 
前 ,双方 都 预期 所 有 p 的 可 能 性 从 而 进行 下 一 次 博弈 ,并 且 每 次 博弈 的 结构 相同 。 下 面 
我 们 分 两 种 情况 考虑 其 中 一 方 的 博弈 策略 。 

1. 触发 策略 

触发 策略 又 称 冷酷 策略 , 指 我 首先 选择 信任 你 ; 如 果 你 也 守信 ,我 将 继续 信任 你 ; 但 
一 旦 你 滥用 了 我 对 你 的 信任 ,我 将 永远 不 再 信任 你 。 假 设 A、B 在 博弈 。 如 果 参 与 者 A 
在 上 一 轮 博弈 中 因 采 取 * 背 叛 策 略 获 利 w 个 单位 ,并 使 参与 者 了 B 受 损 ,那么 在 本 次 博弈 中 
参与 者 B 将 会 选择 “背叛 ”策略 来 报复 A, 且 永远 采用 这 种 策略 。 自 此 以 后 , A 每 期 的 收 
入 均 为 0, 所 以 总 期 望 ( 折 现 ) 收 入 仍 为 a 个 单位 。 如 果 A 在 上 一 轮 博弈 中 选择 “合作 ”, 获 
利 42/2 个 单位 ,那么 B 企 业 也 将 选择 “合作 ”, 则 A 随后 每 一 阶段 收入 都 是 /2。 重 复 博 弈 
下 的 折 现 收入 为 


六 .A a A 
2 2(1 一 9) 
因此 ,只 要 元 计 太 >oy 即 31 一 M/(2a) ,合作 互惠 是 最 优 的 选择 。( 合 作 , 合 作 ) 便 成 了 


每 一 个 阶段 的 均衡 结果 。 博 穿 双 方 为 了 获得 更 长 期 、 更 稳定 的 利益 ,走出 了 一 次 性 博弈 的 
困境 ,理性 地 克制 投机 行为 ,选择 诚信 与 合作 ,这 就 是 重复 博弈 所 创造 的 信用 机 制 , 其 核心 
在 于 当事人 为 了 合作 的 长 远 利益 ,牺牲 眼前 利益 。 冷酷 战略 的 结果 使 得 任何 一 方 都 没有 
动机 偏离 合作 ,博弈 得 以 进行 下 去 。 但 是 ,这 种 战略 过 于 简单 ,并 不 是 现实 策略 互动 的 近 
似 描述 。 而 且 如 果 对 方 真 的 选择 背叛 ,这 种 战略 对 实施 惩罚 的 一 方 来 说 也 是 代价 高 昂 ,其 
程度 和 受罚 者 一 样 , 即 触发 战略 容易 导致 两 败 俱 伤 的 局 面 。 因 此 ,我 们 重点 考虑 男 一 种 
策略 。 
2. 针锋相对 策略 


< 引 语 故 事 : 重庆 谈判 中 国共 产 党 的 方针 


1945 年 抗日 战争 胜利 后 ,为 避免 内 战争 取 和 平 , 中 国共 产 党 同 国民 党 政府 在 重庆 进 
行 了 为 期 43 天 的 和 平 谈判 , 史 称 "重庆 谈判 ”。 

谈判 之 前 ,蒋介石 就 让 阁 锡 山 入 侵 上 党 地 区 ,以 此 先发制人 ,扼守 抢夺 平津 、 独 占 华北 
的 交通 要 道 ,保持 长 江 与 北方 之 间 的 陆 上 联系 。 当 时 国共 之 间 的 军事 摩擦 已 经 出 现 。 

8 月 25 日, 即 毛泽东 电 复 蒋介石 将 亲自 赴 重 庆 谈 判 的 当天 ,他 对 即将 返回 上 党 前 线 
的 刘伯承 、 邓 小 平 说 :“ 你 们 回 到 前 方 去 ,放手 打 就 是 了 。 不 要 担心 我 在 重庆 的 安全 问题 ， 
你 们 打 得 越 好 ,我 越 安 全 , 谈 得 越 好 。 别 的 办 法 是 没有 的 。” 刘 、 邓 回 到 上 党 ,在 上 党 战役 的 
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动员 报告 中 指出 :“ 我 们 立足 于 打 , 不 放弃 有 利 条 件 的 谈判 。 只 有 打 得 好 ,才能 谈 得 好 。” 

就 这 样 ,国共 和 谈 在 边 打 边 谈 中 进行 。 

重庆 谈判 从 8 月 28 日 毛泽东 赴 重 庆 开始 ,至 10 月 11 日 ,前 后 共 43 天 ; 上 党 战役 从 
9 月 1 日 攻克 襄 垣 开始 ,到 10 月 8 日 解放 长 治 ,12 日 全 歼 逃 敌 而 胜利 结束 ,历时 42 天 。 
重庆 谈判 桌 上 与 上 党 战场 无 论 时 间 、 进 展 情况 极其 一 致 ,密切 相关 , 绝 非 偶然 。 

中 国共 产 党 的 方针 是 “以 打 促 谈 ”,“ 打 而 胜 之 ”是 共产 党 重庆 谈判 桌 上 的 重要 筹码 ,也 
是 国共 和 谈 取 得 成 功 的 保障 。 

中 国共 产 党 正 是 采取 了 "针锋相对 策略 "”。 首 先 ,人 民 解 放 军 绝 不 开 第 一 枪 , 所 以 是 善 
意 的 ; 其 次 ,一 旦 国民 党 军队 挑 起 军事 冲突 ,人 民 解 放 军 立即 报 以 颜色 ,这 表明 共产 党 是 
“可 被 激怒 的 ”; 最 后 ,共产 党 不 会 得 理 不 饶 人 ,你 停火 ,我 就 停火 ,这 表明 共产 党 是 “ 宽 
容 的 ”。 

其 结果 是 ,国共 两 党 达成 了 和 平 协议 (虽然 后 来 内 战 还 是 爆发 ,但 它 不 属于 本 文 讨论 的 
范围 )。 除 此 之 外 ,中 国 军队 在 朝鲜 战争 、 中 印 边境 自卫 反击 战 、 对 越 自卫 反击 战 等 战争 中 ， 
采取 的 均 是 “人 不 犯 我 ,我 不 犯人 ; 人 若 犯 我 ,我 必 犯 人 ”以 及 * 边 打 边 谈 ” 的 针锋相对 策略 。 


针锋相对 策略 又 称 " 以 牙 还 牙 ” 策 略 , 是 指 采 取 和 上 一 轮 对 手相 同 的 策略 。 在 博弈 中 ， 
首先 选择 合作 。 在 对 方 背叛 后 ,选择 在 未 来 连续 一 段 时 间 内 惩罚 博弈 对 手 。 如 果 犯 规 者 
在 这 期 间 一 直 守 信 ,那么 他 将 得 到 原谅 ,诚实 交易 将 继续 进行 下 去 。 如 果 在 惩罚 期 间 受 罚 
人 又 选择 了 违约 ,那么 惩罚 期 将 重新 开始 。 这 种 策略 融 善良 性 严厉 性 和 宽容 性 于 一 体 。 
既 给 予 对 方 一 定 程度 的 惩罚 ,但 又 不 致使 对 方 失去 合作 的 信心 ,合作 得 以 继续 进行 下 去 。 
在 阿 克 谢 罗 德 计算 机 程序 模拟 比赛 的 研究 中 ,合作 者 的 胜利 不 仅 证 明了 信用 合作 在 个 体 
博弈 中 作为 占 优 均 衡 出 现 的 可 能 ,而 且 还 为 这 种 均衡 的 演化 过 程 提供 了 新 的 研究 起 点 。 
他 在 比赛 中 还 发 现 , 凡 是 具有 善良 性 (从 来 不 首先 背叛 ) 和 宽容 性 (在 对 方 背 叛 以 后 仍 具有 
合作 的 倾向 ) 的 程序 都 得 分 较 高 。 

针锋相对 策略 集中 了 善良 和 宽容 的 特征 ,而 且 思 路 非常 清晰 : 从 不 首先 背叛 ,然后 采 
取 与 对 方 的 上 一 次 行为 相同 的 行动 。 对 此 . 阿 克 谢 罗 德 的 解释 是 ,针锋相对 的 善良 性 防止 
参与 者 陷 人 非 合作 的 麻烦 中 ,对 对 方 背叛 的 报复 则 保证 了 对 方 背叛 行为 的 谨慎 性 ,宽容 性 
则 有 助 于 在 对 方 背叛 后 重新 开始 合作 ,而 简单 清晰 的 规则 易于 被 人 理解 ,从 而 导出 长 期 的 
合作 。 

针锋相对 策略 的 优越 性 向 我 们 充分 展示 了 一 个 纯粹 自 利 的 人 何以 会 选择 善意 ,只 因 
为 合作 是 自我 利益 最 大 化 的 一 种 必要 手段 。 比 如 在 爱情 中 的 重复 博弈 原则 应 该 是 : 

(1) 善意 而 不 是 恶意 地 对 待 恋 人 。 

(2) 宽容 而 不 是 尖 刻 地 对 待 恋人 。 

(3) 强硬 而 不 是 软弱 地 对 待 恋人 。 要 在 我 永远 爱 你 的 善意 的 前 提 下 ,做 到 有 爱 必 报 ， 
有 恨 必 报 ,以 眼 还 眼 , 以 牙 还 牙 , 以 其 人 之 道 , 还 治 其 人 之 身 。 例 如 ,对 于 恋人 与 其 他 异性 
的 亲热 行为 ,要 有 极其 强烈 的 敏感 与 斩钉截铁 的 回报 。 

(4) 简单 明了 而 不 是 山 环 水 绕 地 对 待 恋人 。 在 博弈 中 过 分 复杂 的 策略 使 得 对 手 难于 
理解 ,无 所 适 从 ,因而 难以 建立 稳定 的 合作 关系 。 明 晰 的 个 性 、 简 练 的 作风 和 坦诚 的 态度 
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才 是 制胜 的 要 诀 。 

无 论 是 触发 战略 ,还 是 针锋相对 战略 ,都 表明 只 要 交易 者 能 够 重复 相遇 ,双方 又 有 足 
够 的 耐心 ,战略 就 能 够 得 到 合理 且 有 效 的 执行 ,那么 受骗 方 终止 未 来 所 有 与 对 方 的 交易 机 
会 的 威胁 将 有 可 能 遏制 双方 的 机 会 主义 行为 ,形成 信用 合作 的 共有 信念 。 


< 扩展 阅读 : 罗伯特 阿 克 谢 罗 德 的 竞赛 实验 


罗伯特 。， 阿 克 谢 罗 德 (Robert Axelord) ,1943 年 出 生 于 芝加哥 , 曾 就 读 于 芝加哥 大 学 
和 耶鲁 大 学 ,现在 是 密 欢 根 大 学 政治 学 教授 。1980 年 ,为 了 研究 合作 问题 ,他 组 织 了 一 次 
关于 囚徒 困境 的 不 同 策略 的 比赛 。 

阿 克 谢 罗 德 在 开始 研究 合作 之 前 , 设 定 了 两 个 前 提 : 四 每 个 人 都 是 自私 的 ; 回 没有 
任何 权威 干预 每 个 人 的 决策 。 也 就 是 说 ,个 人 可 以 完全 按照 自己 利益 最 大 化 的 企图 进行 
决策 。 在 此 前 提 下 ,合作 要 研究 的 三 个 问题 是 : 首先 ,人 为 什么 要 合作 ; 其 次 ,人 什么 时 
候 是 合作 的 ,什么 时 候 又 是 不 合作 的 ; 最 后 ,如 何 使 别人 与 你 合作 。 

在 研究 的 过 程 中 ,他 组 织 了 一 场 计算 机 模拟 竞赛 ,竞赛 的 思路 非常 简单 : 任何 想 参 加 
这 个 计算 机 竞赛 的 人 都 扮演 * 因 徒 困境 ”案例 中 一 个 因 犯 的 角色 ,他 们 开始 玩 “ 因 徒 困境 ” 
的 游戏 ,每 个 人 都 要 在 合作 与 背叛 之 间 做 出 选择 。 关 键 问 题 在 于 ,他 们 不 止 玩 一 遍 这 个 游 
戏 , 而 是 一 人 遍 一 遍地 玩 上 200 次 ,这 就 是 所 谓 的 “重复 的 囚徒 困境 ”, 于 是 这 就 更 逼真 地 反 
映 了 日 常人 际 关系 。 首 先 由 14 个 人 参与 实验 ,每 两 个 人 为 一 组 ,进行 重复 200 次 的 博弈 ， 
博弈 记分 规则 为 : 如 果 都 合作 ,每 方 计 2 分 ,都 对 抗 每 方 计 0 分 ,一 方 合作 一 方 对 抗 则 合 
作者 计 一 1 分 而 对 抗 者 记 4 分 。 然 后 再 重新 分 组 ,直到 两 两 比赛 过 。 

实验 的 结果 使 阿 克 谢 罗 德 大 为 吃惊 ,因为 竞赛 的 冠军 获得 者 一 一 多 伦 多 大 学 的 数学 
教授 阿 纳 托 。 拉 帕 波 特 所 采取 的 策略 不 仅 不 高 深 ,而 且 非 常 简单 : 一 报 还 一 报 ( 以 牙 还 
牙 ) 。 实 际 上 , 它 也 就 是 我 们 通常 所 说 的 “以 其 人 之 道 , 还 治 其 人 之 身 ”。 它 的 特点 是 : 第 
一 次 对 局 采用 合作 的 策略 ,以 后 每 一 步 都 紧 紧 跟随 对 方 上 一 步 的 策略 ,你 上 一 次 合作 ,我 
这 一 次 就 合作 ,你 上 一 次 不 合作 ,我 这 一 次 就 不 合作 。 

为 了 进一步 验证 第 一 轮 游戏 得 到 的 结论 , 阿 克 谢 罗 德 邀请 了 更 多 的 人 再 做 一 次 游戏 。 
这 时 游戏 进入 了 第 二 轮 。 第 二 次 阿 克 谢 罗 德 征集 到 了 62 个 程序 ,同样 也 附加 上 他 自己 的 
随机 程序 ,又 进行 了 一 次 竞赛 。 结 果 , 排 在 第 一 名 的 仍 是 针锋相对 策略 。 

这 个 如 此 简单 的 策略 之 所 以 反复 赢得 竞赛 ,是 因为 它 奉行 了 针锋相对 的 (tit-for-tat) 
法 则 ,说白 了 就 是 一 报 还 一 报 , 即 “ 人 不 犯 我 ,我 不 犯人 ; 人 车 犯 我 ,我 必 犯 人 ”, 但 它 坚 持 有理 、 
有 利 \ 有 节 ” 的 尺度 ,并 且 用 以 下 有 规律 可 供 遵循 的 行为 将 对 手 纳入 长 期 合作 的 轨道 上 来 : 

第 一 ,善良 的 , 即 从 不 首先 背叛 。 

第 二 ,可 激怒 的 ,对 于 对 方 的 背叛 行为 一 定 要 报复 ,不 能 总 是 合作 。 

第 三 ,宽容 的 ,不 能 人 家 一 次 背叛 ,你 就 没完 没 了 地 报复 ,以 后 人 家 只 要 改 为 合作 ,你 
也 要 合作 。 

第 四 ,易于 察觉 的 , 即 逻 辑 清 晰 ,使 对 手 能 够 很 轻易 地 发 现 你 采取 策略 的 规律 ,并 且 领 
会 你 的 意图 。 

而 输 掉 这 个 竞赛 的 策略 ,总 是 在 上 述 4 个 方面 做 得 不 够 好 。 比 如 竞赛 者 的 脾气 过 于 
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好 ,总 是 “以 德 报 怨 ”, 结 果 就 被 独 独 之 徒 反复 地 占便宜 ; 有 些 竞 赛 者 不 够 宽容 ,采取 触发 
策略 ,别人 背叛 一 次 他 就 不 与 对 方 再 次 合作 ,从 而 使 合作 关系 永久 性 断绝 ; 还 有 一 些 竞 赛 
者 太 “ 精 于 算计 ”, 总 是 试图 通过 取 巧 来 占 别 人 的 便宜 ,这 种 人 在 与 “好 脾气 者 ”的 博弈 中 虽 
然 大 占便宜 ,但 与 “不 宽容 者 ?的 博弈 中 往往 搬 起 石头 砸 自己 的 脚 ,而 从 最 后 的 总 分 来 看 ， 
他 的 “小 聪明 ”总 是 得 不 偿 失 的 。 


重复 博弈 的 故事 讲 到 这 里 ,想必 你 已 经 了 解 到 了 重复 博弈 应 用 的 广泛 。 下 面 我 们 要 
用 博弈 论 的 分 析 手 段 解释 精致 的 利 已 主义 者 的 行为 ,以 此 作为 本 章 的 终结 。 


EC 扩展 阅读 : 精致 的 利己 主义 者 


他 们 主动 向 政府 交 税 ,甚至 常常 拿 钱 做 琵 善 。 他 们 积极 参与 各 种 平权 运动 ,支持 女性 、 
少数 族 毅 、 同 性 恋 以 及 任何 被 歧视 的 人 和 群 。 他 们 教育 孩子 要 乐于 助人 ,和 同学 们 分 享 、 玩 乐 。 

也 许 你 会 觉得 疑惑 ,这 些 热 衷 于 利他 主义 的 人 ,为 什么 会 是 利 已 主义 者 ? 其 实 不 必 奇 
怪 , 所 谓 精 致 的 利己 主义 者 ,是 懂得 可 持续 发 展 的 利己 主义 者 ,是 有 着 利他 主义 名 声 的 利 
己 主义 者 ,是 最 能 实现 自己 利己 目标 的 利己 主义 者 。 

他 们 为 什么 要 帮助 弱势 群体 ? 是 因为 坚持 自由 和 平等 能 帮 他 们 维持 自己 的 好 声誉 。 
他 们 为 什么 不 把 小 孩 当 作 致 富 的 工具 ? 是 因为 他 们 要 让 小 孩 更 好 地 成 长 ,更 好 地 繁衍 后 
代 , 播 散 自己 的 基因 。 他 们 为 什么 愿意 将 自己 所 拥有 的 资源 分 给 他 人 ,无 论 是 金钱 还 是 知 
识 ? 是 因为 他 们 希望 别人 认为 他 们 是 好 的 合作 者 ,能 和 自己 进行 社会 合作 。 

如 果 说 利己 主义 者 奉行 弱肉强食 策略 ,积极 推行 着 以 自己 为 强 的 标准 ,那么 精致 的 利 
已 主义 者 则 更 关注 平等 ,促进 整个 社会 的 发 展 ,使 得 自己 以 及 后 代 能 活 在 一 个 更 富裕 、 文 
明 的 世界 里 。 

那些 计算 早已 印 刻 在 精致 的 利己 主义 者 的 脑海 深 处 ,他 们 能 下 意识 地 选择 那些 普通 
利 已 主义 者 所 不 解 或 者 部 视 的 行为 ,因为 他 们 能 看 到 更 远 的 将 来 而 不 只 眼前 的 利益 。 他 
们 不 是 利他 主义 者 ,其 行为 背后 的 动机 无 非 是 : 尽力 追求 着 一 个 好 的 声誉 ,让 自己 能 活 得 
更 好 ,而 副作用 是 让 别人 也 活 得 更 好 。 

这 不 禁 让 人 想起 亚当 。， 斯 密 的 经 典 名 句 :“ 我 们 的 晚餐 ,可 不 是 来 自 屠夫 、 酿 酒 商 和 
面包 师 的 仁慈 ,而 是 来 自 他 们 对 自己 利益 的 关注 。 我 们 不 求助 于 他 们 的 博爱 ,而 是 求助 于 
他 们 的 自 利 心 ; 我 们 谈论 的 绝 不 是 我 们 自己 的 需要 ,而 是 他 们 的 好 处 。” 

所 有 的 利他 与 合作 ,都 是 理性 人 权衡 长 远 利益 后 的 计算 结果 。 只 要 我 们 看 得 更 深远 一 
些 , 不 难 发 现 ,虽然 合作 可 能 在 菜 一 特定 博弈 中 降低 参与 者 的 盈利 ,但 是 以 后 可 能 带 来 的 回 
报 却 足 以 使 一 个 自私 的 人 相信 ,合作 是 一 个 理性 策略 。 没 有 无 故 的 利他 ,没有 永远 的 合作 。 


第 7 章 演化 博弈 * 


(人 -~ 

为 什么 长 颈 鹿 的 脖子 越 来 越 长 ?为何 青蛙 长 于 鸣叫 而 极乐 鸟 却 善于 跳舞 ? 答案 显 而 
易 见 ,这 是 进化 的 结果 。 但 是 进化 进程 与 博弈 有 什么 联系 呢 ? 回 到 人 类 社会 , 当 嘲 遇 他 人 
挑 钙 时 ,你 更 倾向 于 “ 挥 源 争 高 下 ”, 还 是 “三 思 而 后 行 ?? 当 热 心 助 人 反 被 诬陷 时 ,你 是 否 
仍然 坚持 自己 的 善行 不 动摇 ? 随 着 时 间 的 推移 和 经 验 的 积累 ,人 们 会 慢 慢 地 调整 自己 的 
行为 。 尽 管 有 些 行为 看 似 偏 离 了 “理性 ”, 但 它 是 一 种 演化 ,是 一 种 “有 限 理 性 ”。 此 时 ,人 
们 往往 “回顾 身后 ”, 根 据 历史 经 验 确 定 调 整 的 原则 ,而 非 *“ 向 前 展望 "。 本 章 所 要 讨论 的 ， 
正 是 在 这 种 情况 下 的 行为 。 本 章 将 从 演化 角度 介绍 博弈 的 新 思路 ,从 而 揭示 人 和 群 或 生物 
种 群 的 行为 是 如 何 演化 的 ,如 何 相 互 影响 的 。 


局 引 语 故事 : 拔 旗 , 拔 旗 ! 


让 我 们 来 做 一 个 游戏 。 

把 全 班 同学 分 为 A、B 两 队 ,两 队 同 学 相对 而 立 , 中 间 的 地 面 插 着 21 支 旗 ,A 队 和 电 
队 轮 流 移 走 这 些 旗 。 在 轮 到 自己 时 ,每 队 可 以 选择 取 走 1 支 .2 支 旗 或 3 支 旗 。 不 能 一 支 
都 不 取 , 也 不 能 一 次 取 走 4 支 旗 或 4 支 旗 以 上 。 哪 一 队 取 走 最 后 一 支 旗 , 哪 一 队 获 胜 。 输 
了 的 一 组 ,要 淘汰 掉 自己 队 的 一 个 队员 ,然后 比赛 继续 。 

在 游戏 开始 前 ,每 个 队 都 有 几 分 钟 时 间 让 成 员 们 讨论 。A 队 先 行动 , 它 第 一 次 取 走 2 
支 旗 , 现 在 还 剩 下 19 支 旗 。 假如 你 是 BB 队 的 成 员 , 你 会 选择 拿 走 多 少 支 旗 ? 你 可 以 拿 起 
笔 把 你 的 选择 记录 下 来 。 

在 卫队 的 讨论 过 程 中 ,B 队 一 个 成 员 这 样 分 析 道 :“ 不 管 怎么 选择 ,我 们 最 后 一 轮 必 
须 给 他 们 4 支 旗 。” 这 个 见解 是 对 的 ,因为 如 果 最 后 一 轮 留 给 对 方 4 支 旗 , 那 么 对 方 无 论 取 
走 1 支 旗 .2 支 旗 或 3 支 旗 , 取 胜 的 都 是 自己 。 最 后 ,B 队 果 然 在 游戏 中 取胜 ,因为 他 们 在 
还 剩 6 支 旗 时 , 拿 走 了 2 支 。 

之 前 ,在 还 剩 9 支 旗 时 ,A 队 从 中 拿 走 3 支 。 他 们 中 的 某 个 成 员 , 突 然 发 现 了 这 个 问 
题 ;“ 如 果 B 队 接 下 来 取 走 2 支 旗 ,我 们 就 输 了 。” 因 此 ,A 队 刚才 的 行动 是 错 的 ,他 们 不 应 
该 取 3 支 。 假 如 可 以 重 来 ,他 们 该 取 走 几 支 呢 ? 

其 实 刚才 的 推理 已 经 给 了 我 们 答案 ,只 要 在 最 后 一 轮 留 给 对 方 4 支 旗 就 可 以 了 。 那 
么 在 下 一 轮 时 ,怎样 才能 确保 给 对 方 留 下 4 支 旗 呢 ? 答案 是 在 前 一 轮 中 给 对 方 留 下 8 支 
旗 。 理 由 如 下 : 在 还 剩 下 8 支 旗 的 时 候 , 如 果 对 方 取 走 3 支 , 那 么 你 就 取 走 1 支 ,还 剩 下 4 
支 ; 如 果 对 方 取 走 2 支 ,那么 你 也 取 走 2 支 .还 剩 下 4 支 ; 如 果 对 方 取 走 1 支 ,那么 你 就 取 
走 3 支 ,也 还 是 4 支 。 因 此 ,如 果 A 队 在 只 剩 下 9 支 旗 时 , 取 走 1 支 就 能 扭转 战局 。A 队 
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在 最 后 时 刻 虽然 已 经 醒悟 了 ,但 结局 已 经 无 法 改变 。 

继续 追溯 ,在 前 一 轮 中 BB 队 从 剩 下 的 11 支 旗 中 取 走 了 2 支 , 所 以 轮 到 A 队 时 还 剩 下 
9 支 旗 。 如 果 此 时 A 队 选 择 取 走 1 支 斌 ,就 只 剩 下 8 支 底 , 那 么 卫队 就 给 了 。 怎 么 才能 保 
证 给 对 方 留 下 8 支 旗 呢 ? 在 前 一 轮 时 ,你 必须 给 对 方 留 下 12 支 旗 ; 以 此 类 推 ,之 前 两 轮 
分 别 是 16 支 .20 支 。 所 以 ,A 队 只 须 在 开始 时 仅 取 1 支 旗 , 就 能 确保 胜利 。 也 许 有 人 会 
问 , 是 不 是 先行 者 一 定 能 取得 胜利 ? 并 不 是 。 在 拔 旗 游戏 中 ,如 果 开 始 时 的 旗子 是 20 支 
而 非 21 支 ,那么 获胜 的 一 定 是 后 行者 。 


可 见 , 拨 旗 游戏 不 存在 任何 不 确定 性 : 参与 者 的 行动 和 能 力 、 某 些 自然 的 机 会 因素 以 
及 他 们 的 实际 行动 都 是 确定 的 ,这 是 一 种 简单 的 均衡 。 但 是 在 实际 中 你 看 到 的 并 不 是 这 
样 一 种 简单 的 确定 性 结果 ,而 是 复杂 多 样 的 ! 究 其 原因 ,大 多 数 参与 者 的 决定 来 自 他 们 的 
直接 经 验 ,而 非 前 几 章 的 思路 : 向 前 看 到 遥远 的 终点 ,然后 进行 逆向 推理 。 由 此 引出 来 一 
个 问题 ,人 们 的 行为 模式 到 底 是 向 前 看 还 是 向 后 看 ? 


了 “向 前 看 ”还 是 “向 后 看 ” 


“向 前 看 ”或 “向 后 看 ”, 是 决策 主体 的 不 同 “ 理 性 "造成 的 。 尽 管 博 弈 理论 要 求 参 与 者 
是 理性 的 。 但 是 从 更 广泛 的 角度 来 看 ,理性 也 有 不 同 的 准则 。 在 开始 讨论 之 前 ,首先 需要 
给 “向 前 看 ”和 “向 后 看 ”一 个 通俗 的 解释 。 

“向 前 看 ”是 指 无 论 过 去 发 生 了 什么 ,参与 者 都 是 向 前 看 的 , 亦 即 在 未 来 所 采取 的 行动 
都 是 最 优 反应 。 而 “向 后 看 ” 则 是 指 , 参 与 者 在 做 出 决定 前 都 是 先 回顾 自己 的 过 去 ,根据 过 
去 的 历史 经 验 推测 将 来 ,在 行动 上 做 出 调整 。 这 是 两 种 不 同 的 理性 。 如 有 经 济 学 基础 ,你 
一 定 觉 得 上 面 的 概念 似曾相识 ,此 处 的 “向 前 看 " 正 是 经 济 学 中 的 “理性 预期 ”而 “向 后 看 ” 
对 应 着 “适应 性 预期 ”。 

对 拔 旋 游 戏 所 做 的 逆向 归纳 是 典型 的 "向 前 看 ”, 即 每 一 队 拔 旗 者 都 清楚 地 知道 自己 
的 最 优 反应 和 对 手 的 最 优 反应 ; 并 且 在 所 有 拔 旗 者 都 是 相同 理性 的 前 提 下 ,每 个 队 的 最 
优 策略 是 唯一 的 。 正 如 前 文 所 说 ,实际 上 游戏 存在 着 复杂 多 变 的 结果 。 这 是 因为 “向 前 
看 ”的 思路 意味 着 完全 理性 。 那 么 ,何谓 完全 理性 ? 


7.1.1 完全 理性 


完全 理性 这 一 概念 在 前 几 童 已 经 遇见 过 。 与 新 古典 经 济 学 中 以 “个 体 理性 ”为 基础 的 
“经 济 人 ” 相 比 较 , 完 全 理性 比 它 所 要 求 的 理性 程度 还 要 高 。 完 全 理性 不 仅 要 求 行为 主体 
始终 以 自身 利益 最 大 化 为 目标 ,具有 在 确定 和 非 确定 性 环境 中 追求 自身 利益 最 大 化 的 判 
断 和 决策 能 力 , 还 要 求 他 们 在 存在 交互 作用 的 博弈 环境 中 也 具有 完美 的 判断 和 预测 能 力 。 
它 不 仅 要 求人 们 自身 是 理性 的 ,还 要 求人 们 相信 对 方 也 是 理性 的 ,拥有 “理性 的 共同 
知识 ”。 
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过 概念 解读 ,完全 理性 


关于 理性 ,在 2. 1.4 节 已 有 阐述 ,此 处 仅 为 断 章 阅 读者 提供 参考 。 如 图 7-1 所 示 , 甲 
乙 两 人 进行 博弈。 


乙 
D E 
^ | 1.2 i3 02 
s B 0,5 03 5.2 


图 7-1 完全 理性 博弈 矩阵 一 


对 于 乙 而 言 ,D 策略 是 下 策略 的 占 优 策略 。 所 以 在 任何 情况 下 乙 都 不 会 选择 下 策 
略 。 那 么 ,对 于 二 人 而 言 博弈 的 矩阵 如 图 7-2 所 示 。 


申 
。 


图 7-2 完全 理性 博弈 矩阵 二 


此 时 对 于 甲 而 言 ,A 策略 是 日 策略 的 占 优 策略 , 所 以 甲 一 定 会 选择 A。 进 而 , 乙 一 定 
会 选择 D。 可 见 ,(A,D) 是 该 博弈 的 均衡 。 

回 过 头 来 再 看 这 个 结果 是 如 何 得 到 的 。 在 最 开始 选择 的 时 候 , 乙 不 会 选择 下 。 这 是 行 
为 主体 始终 以 自身 利益 最 大 化 为 目标 的 必然 结果 ,而 依据 则 是 ^ 乙 是 理性 经 济 人 ”。 而 且 在 
乙 做 出 这 个 决策 的 时 候 不 用 考虑 甲 的 行为 ,因为 无 论 甲 做 出 哪 种 选择 , 乙 都 不 会 选择 EE。 

此 时 ,对 于 甲 而 言 就 不 仅 是 自己 理性 了 。 甲 在 做 出 选择 之 前 需要 先知 道 " 乙 不 会 选择 
E”, 而 “ 乙 不 会 选择 E? 就 成 了 二 人 有 关 理 性 的 共同 知识 。 基 于 以 上 信息 , 甲 会 做 出 选择 A 
的 策略 。 

紧 接 着 ,将 “ 甲 选择 A” 作 为 甲乙 二 人 有 关 理 性 的 共同 知识 ,指导 着 乙 的 决策 ,并 最 终 
形成 (A,D) 这 样 一 个 均衡 。 甲 乙 二 人 都 需要 对 对 方 的 行动 有 一 个 预测 ,并 且 这 些 预测 建 
立 在 对 方 也 是 理性 人 的 假设 之 上 。 

这 样 的 理性 称 为 “完全 理性 ”。 

尽管 完全 理性 假设 具有 令 人 称赞 的 完美 体系 和 预测 能 力 ,但 是 这 种 完美 只 是 理想 模 
式 和 方法 ,不 仅 在 经 济 学 内 部 有 争论 ,也 经 不 起 实践 和 现实 的 考验 。 

首先 ,博弈 中 参与 者 的 行动 不 仅 受 到 理性 的 驱使 也 受到 感性 因素 的 影响 。 最 早 指出 
这 一 点 的 是 凯恩斯 ,他 在 (通论 ) 中 论述 了 情绪 波动 (尤其 是 信心 或 “工商 界 所 谓 的 信任 状 
态 ”) 长 期 预期 状态 及 其 对 市 场 投资 的 影响 。 凯 恩 斯 还 指出 ,参与 者 并 不 具有 完全 理性 所 
能 导致 的 完全 预期 ,这 也 因 情 绪 而 起 。 之 后 ,西蒙 从 心理 学 角度 出 发 ,提出 参与 者 的 行动 
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是 由 理性 和 感性 共同 作用 的 ; 卡 尼 曼 结合 行为 科学 和 经 济 心 理学 的 观点 ,同样 指出 行为 
人 的 行动 受到 直觉 和 推理 两 个 系统 的 影响 。 

其 次 ,博弈 的 参与 者 不 具备 完全 的 计算 和 逻辑 推理 能 力 , 也 无 法 像 先知 一 样 可 以 预测 
未 来 。 西 蒙 曾 明确 指出 ,参与 者 只 具备 受到 限制 的 理性 能 力 , “意欲 理性 而 只 能 有 限 为 
之 ”。 人 类 计算 和 人 逻辑 推理 能 力 的 有 限 性 ,在 柯 洁 与 计算 机 (AlphaGo) 的 围棋 比赛 中 暴露 
无 遗 。 在 输 给 计算 机 之 后 , 柯 洁 坦 言 :“ 人 类 数 千年 实战 演练 进化 ,计算 机 却 告 诉 我 们 人 
类 全 都 是 错 的 。 我 觉得 ,甚至 没有 一 个 人 沾 到 围棋 真理 的 边 。” 

再 次 ,博弈 的 参与 者 具有 异 质 性 。 参 与 者 并 非 都 是 同 质 的 ,而 是 具有 异 质 性 。 这 是 完 
全 理性 假设 中 最 不 容易 成 立 的 一 项 内 容 。 由 于 年 龄 不 同 、 性 别 差异 、 财 富 多 寒 、 知 识 结构 
与 阅历 悬殊 、 信 息 集 相 异 等 因素 ,使 参与 者 的 风险 态度 以 及 偏好 效用 不 同 ,因此 不 同 决策 
主体 即使 面临 着 同样 的 事件 ,也 会 出 现 不 同 的 决策 结果 。 

最 后 ,我们 无 法 将 全 部 选择 的 结果 量化 ,比如 经 济 学 中 的 效用 或 边际 效用 、 成 本 或 边 
际 成 本 。 西 蒙 曾 列举 了 他 于 1934 年 在 密尔沃基 对 市 教育 委员 会 和 市 公共 设施 处 两 机 构 
共同 负责 的 公共 娱乐 设施 管理 的 调研 个 案 。 这 两 个 机 构 在 娱乐 设施 保养 和 游乐 监管 两 方 
面 的 资金 分 配 问题 上 ,总 是 无 法 达成 一 致意 见 。 它 们 没有 遵循 等 边际 原则 ,让 一 种 活动 的 
边际 费用 等 于 另 一 种 活动 的 边际 费用 ,因为 根本 没有 可 以 度量 的 生产 函数 ,能 让 它们 从 中 
得 出 有 关 边 际 生产 率 的 数量 推断 。 

综 上 对 完全 理性 的 批判 ,可 以 看 到 完全 理性 并 不 是 一 个 “ 放 之 四 海 而 丝 准 ”的 假定 ,不 
能 涵盖 所 有 的 博弈 问题 。 一 般 来 讲 , 决 策 的 准则 除了 有 完全 理性 外 ,还 存在 非 理 性 和 有 限 
理性 。 有 限 理性 是 本 章 演 化 博弈 的 主要 准则 ,因而 放 在 稍 后 阐述 。 让 我 们 先 简单 了 解 非 
理性 的 概念 。 


7.1.2 非 理性 


丹 ， 艾 瑞 里 在 《怪诞 行为 学 ) 中 曾 这 样 说 : 

我 们 常常 暗 下 决心 节食 锻炼 ,但 是 只 要 看 到 甜点 小 推 车 一 过 来 ,我 们 的 决心 就 消失 得 
无 影 无 踪 。 你 知道 这 是 为 什么 吗 ? 

我 们 有 时 候 兴 致 勃勃 去 购物 , 买 回来 一 大 堆 东西 , 却 放 在 家 里 用 不 上 。 这 是 为 什么 呢 ? 

头痛 的 时 候 , 我 们 花 5 美 分 买 的 阿司匹林 吃 了 不 见效 ,可 是 花 50 美 分 买 的 阿司匹林 
却 能 立竿见影 。 这 又 是 为 什么 ? 

工作 之 前 让 员工 背 一 下 《圣经 》 十 诚 , 大 家 就 能 比较 诚实 ,起 码 在 刚刚 背 完 的 时 候 是 这 
样 。 如 果 没 这 样 做 ,不 诚实 现象 就 很 多 。 这 又 是 为 什么 呢 ? 换言之 ,为 什么 荣 原 规范 可 以 
减少 工作 场所 不 诚实 现象 ? 

在 现实 生活 中 , 当 决 策 者 在 遇 到 决策 难题 举 步 不 前 时 ,或 者 行事 匆匆 而 无 从 判断 时 ， 
他 们 大 多 依照 自己 的 习惯 猜测、 偏好 等 非 理性 的 心理 因素 ,或 者 盲从 他 人 的 意见 做 出 决 
策 。 这 种 依赖 逻辑 思维 之 外 的 其 他 心理 过 程 和 心理 特征 (包括 直觉 情绪 ,性 格 、 偏 好 、 迷 
信 等 ) 而 做 出 决策 的 现象 , 称 为 “ 非 理性 ”。 客 观 地 说 ,任何 决策 过 程 都 存在 这 种 非 理性 因 
素 的 影响 , 当 这 种 非 理 性 因素 在 决策 过 程 中 占据 主导 地 位 时 ,这 个 决策 就 是 非 理性 决策 。 

当 决策 动机 不 仅仅 是 物质 得 益 最 大 化 ,还 直接 依赖 于 信念 ( 持 有 信念 的 心理 状态 本 身 
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构成 最 终 效用 的 一 部 分 ) 时 ,我 们 说 个 体 具 有 信念 依赖 的 动机 (偏好 )。 信 念 依 赖 动机 为 人 
类 所 普遍 持 有 。 信 念 以 目的 \ 动 机 的 形式 贯穿 于 人 类 活动 中 ,并 与 情感 ,意志 相 结合 ,形成 
一 种 稳固 的 支配 人 类 行动 的 心理 倾向 。 

在 经 济 决策 中 ,由 于 个 体会 从 对 未 来 的 期 望 中 获得 当前 效用 ,“ 向 前 看 ”的 决策 者 会 扭 
曲 信念, 壁 如 ,个 体会 选择 相信 更 有 利于 自己 的 信念 。 而 期 望 偏差 会 导致 错误 的 决策 和 非 
理性 结果 的 出 现 , 比 如 ,在 投资 中 决策 者 可 能 过 高 估计 投资 的 回报 而 做 出 非 理性 的 决策 。 
无 论 在 微观 层面 还 是 在 宏观 层面 ,主观 信念 对 经 济 决策 结果 都 具有 重要 影响 。 


2 扩展 阅读 : 《怪诞 行为 学 ) 节 选 


ee 就 我 们 对 人 类 理性 的 信念 而 言 , 人 人 都 是 经 济 学 家 。 我 不 是 说 我 们 每 个 人 都 能 
赁 直觉 创造 出 复杂 的 博弈 论 模型 或 懂得 一 般 显 示 性 偏好 公理 (GARP) ,而 是 说 我 们 对 人 
类 本 性 的 基本 信念 与 经 济 学 的 立论 基础 是 相同 的 。 在 本 书 中 ,我 提 及 的 理性 经 济 模型 ,就 
是 指 多 数 经 济 学 家 和 我 们 很 多 人 对 人 类 本 性 的 基本 假定 一 这 一 既 简 单 又 令 人 信服 的 理 
念 , 即 我 们 能 够 做 出 正确 的 决定 。 

虽然 对 人 类 能 力 的 帮 旺 之 情 是 合情合理 的 ,但 是 敬佩 之 心 是 一 回 事 ,认为 我 们 的 推断 
能 力 完 美 无 缺 是 另 一 回 事 , 二 者 相去 甚 远 。 事 实 上 ,本 书 探讨 的 就 是 人 类 的 非 理 性 一 一 我 
们 与 完美 之 间 的 差距 。 我 相信 这 样 的 探讨 对 于 探求 真正 的 自我 是 非常 重要 的 ,并 且 还 能 
使 我 们 在 现实 中 受益 。 深 入 了 解 非 理性 ,对 我 们 日 常 的 行为 和 决定 ,对 理解 我 们 对 环境 的 
设计 以 及 它 给 我 们 提供 的 选择 ,都 很 重要 。 

我 进一步 观察 到 我 们 不 单单 是 非 理 性 的 ,还 是 可 预测 地 非 理 性 的 一 一 我 们 的 非 理 性 
一 次 又 一 次 ,以 相同 的 方式 发 生 。 不 论 我 们 作为 消费 者 生意 人 ,还 是 政策 制定 者 ,懂得 了 
我 们 的 非 理 性 可 以 怎样 预测 ,就 为 我 们 改进 决策 改善 生活 方式 提供 了 一 个 起 点 。 

这 就 把 我 带 到 了 传统 经 济 学 与 行为 经 济 学 之 间 的 真正 “摩擦 ”( 莎 士 比 亚 可 能 会 这 样 
说 ) 中 。 传 统 经 济 学 认为 人 们 都 是 理性 的 一 一 这 一 假定 的 含义 是 ,我 们 能 对 日 常生 活 中 面 
临 的 所 有 选择 的 价值 进行 计算 , 择 其 最 优 者 而 行 之 。 一 旦 我 们 犯 了 错误 ,做 了 非 理性 的 事 
情 , 又 会 怎样 呢 ? 这 里 ,传统 经 济 学 也 有 答案 :“ 市 场 的 力量 ”会 向 我 们 迎面 扑 来 ,迅速 把 
我 们 拉 回 正确 理性 的 道路 上 去 。 事 实 上 ,就 是 基于 这 些 假定 ,从 亚当 。 斯 密 以 来 ,世代 的 经 
济 学 家 们 推导 出 了 深远 的 无 所 不 包 的 种 种 结论 ,从 税收 到 保健 政策 乃至 商品 ,服务 的 定价 。 

但 是 ,你 们 会 从 本 书 中 看 到 ,我 们 远 远 不 像 传统 经 济 学 理论 所 假定 的 那么 理性 。 不 仅 
如 此 ,我 们 这 些 非 理性 行为 并 非 无 规律 无 意识 ,而 是 成 系统 的 。 既 然 我 们 一 再 重复 , 它 就 
是 可 预测 的 。 那 么 ,对 传统 经 济 学 进行 修正 ,使 它 脱离 天 真 的 心理 ( 它 常常 经 受 不 住 推理 、 
内 省 ,尤其 重要 的 是 ,经 不 起 实验 检验 ) ,难道 不 是 顺理成章 的 吗 ? 这 正 是 新 兴 的 行为 经 济 
学 领域 一 一 本 书 作 为 这 项 事业 的 一 小 部 分 一 一 正在 试图 达到 的 目的 。 


7.1.3 有限 理性 


不 难 理解 ,并 非 所 有 人 都 是 完全 理性 的 ,人 们 在 决策 过 程 中 往往 会 有 非 理 性 成 分 的 存 
在 。 因 而 ,基于 “最 优 ” 原 则 的 完全 理性 反而 不 能 带 来 最 优 的 决策 。 这 种 结果 在 实际 中 屡 
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见 不 鲜 。 那 么 什么 样 的 模型 更 加 符合 实际 ? 怎样 决策 才 是 最 合适 的 ? 

为 了 修正 完全 理性 理论 ,西蒙 将 人 的 行为 纳入 经 济 研究 的 范畴 ,通过 对 认 知 心理 学 的 
研究 ,提出 了 “有 限 理 性 ”的 理论 。“ 有 限 理性 ”是 指 人 的 行为 “是 有 意识 的 理性 ,但 这 种 理 
性 又 是 有 限 的 "。 他 提出 有 限 理性 的 概念 :“ 理 性 的 限度 是 从 这 样 一 个 事实 中 看 出 来 的 ， 
即 人 脑 不 可 能 考虑 一 项 决策 的 价值 .知识 及 有 关 行 为 的 所 有 方面 …… 人 类 理性 是 在 心理 
环境 的 限度 之 内 起 作用 的 。” 

从 有 限 理 性 出 发 ,西蒙 提出 了 "满意 型 决策 ”的 概念 。 他 认为 ,完全 理性 会 导致 人 们 寻 
求 最 优 型 决策 ,有 限 理 性 则 导致 人 们 寻求 满意 型 决策 。 

首先 ,他 指出 ,尽管 最 优 型 决策 在 理论 上 和 逻辑 上 是 成 立 的 ,而 在 现实 中 决策 者 既 不 
可 能 考虑 到 所 有 的 决策 方案 ,又 很 难 对 每 一 备 选 方案 的 结果 进行 完全 正确 的 预测 ,因此 不 
可 避免 地 做 出 具有 强烈 个 人 色彩 的 主观 判断 。 其 次 ,对 一 项 决策 是 否 有 正确 的 认 知 ,往往 
受到 决策 者 本 人 对 决策 目标 的 认识 程度 .知识 广度 和 深度 以 及 决策 资料 的 了 解 程度 等 因 
素 的 影响 , 即 决策 者 的 认 知 偏向 也 会 影响 决策 过 程 信息 的 处 理 。 按 照 效 用 函数 计算 出 来 
的 最 佳 方案 ,实际 上 并 不 一 定 会 被 决策 者 视 为 其 心目 中 的 最 佳 方案 。 因 此 ,西蒙 提出 用 满 
意 型 决策 代替 最 优 型 决策 。 所 谓 满意 ,是 指 决策 只 需要 满足 两 个 条 件 即 可 ; 一 是 有 相应 
的 最 低 满 意 标 准 ; 二 是 策略 选择 能 够 超过 最 低 满 意 标准 。 

二 游戏 与 实验 : 合作 积分 

实验 说 明 : 10 个 人 为 一 组 参加 游戏 ,每 个 人 选择 "领导 ?或 “追随 ”, 分 别 记 作 工 或 下 。 

(1) 若 10 个 人 中 有 1~5 人 选择 “追随”, 其 他 人 选择 “领导 ”, 则 小 组 得 1 分 。 

(2) 若 仅 有 6 人 选择 “追随 ”, 另 4 人 选择 “领导 ”, 则 小 组 得 2 分 。 

(3) 若 仅 有 7 人 选择 “追随 ”, 得 3 分 。 

(4) 若 仅 有 8 人 选择 “追随 ”, 得 4 分 。 

(5) 若 仅 有 9 人 选择 “追随”, 得 5 分 。 

(6) 但 是 ,车 10 人 都 选择 “追随 ”, 则 小 组 得 0 分 。 

连续 做 8 轮 实验 ,记录 实验 结果 ,并 进行 比较 。 

让 我 们 来 考察 上 述 实验 的 一 组 结果 。 根 据 上 述 的 实验 规则 ,有 一 个 小 组 经 过 8 轮 的 
实验 ,记录 结果 如 表 7-1 所 示 。 

表 7-1 合作 积分 的 实验 记录 


轮 次 1] 号 2 号 3 号 4 号 5 号 6 号 7 号 8 号 9 号 10 号 得 分 
1 至 下 L F L 玫 L L L 1 分 
2 [3 L FP F F L EL E L 六 2 分 
3 至 L L | F | 3 L L 坚 2 分 
4 至 L FB 把 [3 区 到 L 至 | 4 分 
5 F L F F 于 F bE L F F 4 分 
6 F 到 了 F F F 到 F F F 5 分 
7 F 到 F F ¥ F EF F 村 F 5 分 
8 F L F F F F F F 5 分 
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根据 规则 ,如 果 没 人 选择 “领导 ”, 意 即 A 没有 出 现 . 则 记 为 0 分 。 因 为 每 人 都 无 法 获 
知 其 他 人 的 决策 ,所 以 大 家 无 法 预测 实验 的 确切 结果 。 只 要 LL 不 为 0,L 的 数量 越 少 对 结 
果 越 有 利 ,所 以 ,6 号 .8 号 .9 号 和 10 号 ,在 从 工 变 为 F 之 后 就 再 也 没有 变 回 来 。 可 见 , 在 
游戏 开始 的 时 候 , 所 有 参与 者 的 理性 都 是 有 限度 的 。 同 时 ,你 也 许 已 经 注意 到 ,2 号 和 3 
号 出 现 了 从 下 变 为 L 的 行为 。 在 之 后 的 采访 过 程 中 ,被 试 者 表示 担心 其 他 所 有 人 都 从 工 
变 为 F, 所 以 自己 做 出 了 LL 的 选择 。 这 从 本 质 上 讲 是 因为 他 们 对 结果 的 不 确定 性 难以 

从 游戏 的 过 程 来 看 ,小 组 的 分 数 在 逐渐 提高 ,每 位 被 试 者 都 经 历 了 一 个 学 习 的 过 程 。 
在 第 2 轮 的 时 候 3 号 和 10 号 从 工 变 为 了 F, 此 时 2 号 从 FF 变 为 了 L; 在 第 3 轮 的 时 候 6 
号 从 工 变 为 了 F,3 号 从 F 变 为 了 L; 在 第 4 轮 的 时 候 只 有 2 号 和 8 号 坚持 L。 在 经 过 两 
轮 的 坚持 之 后 ,8 号 选择 了 放弃 。 在 第 6 轮 的 时 候 只 有 2 号 选择 工 ,游戏 达到 了 均衡 。 所 
有 人 没有 动机 再 改变 ,最 终 以 这 种 方式 度 过 了 最 后 3 轮 。 

在 这 个 实验 中 ,所 有 的 参与 者 都 不 是 完全 理性 的 , 即 他 并 不 知道 其 他 人 的 最 优 决策 ， 
甚至 不 知道 自己 的 决策 会 带 来 何 种 结果 。 但 在 游戏 的 过 程 中 ,他 们 逐渐 学 习 他 人 的 行为 ， 
从 而 决定 了 自己 的 最 优 决 策 。 

事实 上 ,这 种 以 有 限 理性 为 基础 考虑 变化 结构 及 环境 的 博弈 分 析 框 架 , 与 建立 在 达尔 
文 自 然 选择 思想 上 的 生物 进化 理论 十 分 相似 。 例 如 ,人 类 在 遇 到 复杂 问题 时 常常 由 直觉 
引发 行为 方式 ,并 模仿 成 功 者 的 行为 ,这 与 其 他 生物 的 行为 很 接近 。 不 仅 如 此 ,人 类 的 竞 
争 合作 行为 与 动物 世界 的 竞争 合作 行为 也 常常 不 谋 而 合 。 

受 此 启发 ,经 济 学 家 将 生物 进化 理论 中 的 进化 思想 引入 了 博弈 论 。 这 种 起 源 于 生物 
进化 理论 的 博弈 分 析 方 法 被 称 为 "演化 博弈 论 ”。 演 化 博弈 论 是 有 限 理性 分 析 的 一 类 重要 
方法 。 它 不 同 于 完全 理性 下 的 分 析 前 提 、 决 策 过程 以 及 行为 均衡 ,此 时 人 们 通常 通过 试 错 
的 方法 达到 均衡 ,与 生物 演化 具有 共性 。 在 接 下 来 的 7.2 节 ,将 重点 介绍 演化 博弈 及 其 均 
衡 的 概念 ,而 7. 3 节 则 介绍 两 种 常见 的 演化 机 制 。 


7.2 演化 与 演化 稳定 策略 


7.2.1 生物 进化 论 


达尔 文 的 生物 进化 论 被 誉 为 19 世纪 自然 科学 的 三 大 发 现 之 一 , 它 首次 勾画 了 生命 由 
简单 向 复杂 、 由 低级 向 高 级 的 发 展 图 式 。 达 尔 文 认为 ,物种 的 进化 是 以 群体 为 单位 的 , 变 
异 时 刻 都 在 发 生 。 如 果 一 种 变异 有 利于 适应 环境 ,那么 这 种 变异 会 被 保留 下 来 ; 如 果 一 
种 变异 不 适应 环境 ,就 会 被 淘汰 ,这 就 是 著名 的 “自然 选择 学 说 ”"。 如 今 我 们 美丽 的 星球 正 
是 几 亿 年 来 生物 不 断 演 化 的 结果 。 

达尔 文 的 自然 选择 学 说 ,主要 内 容 有 4 点 : 过 度 繁殖 .生存 竞 争 . 遗 传 和 变异 及 适 者 
生存 。 

(1) 过 度 繁殖 。 达 尔 文 发 现 ,地 球 上 的 各 种 生物 普遍 具有 很 强 的 繁殖 能 力 ,都 有 依照 
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几何 比率 增长 的 倾向 。 例 如 ,大 象 是 一 种 繁殖 很 慢 的 动物 ,但 是 如 果 每 一 头 肉 象 一 生 
(30 一 90 岁 ) 产 仔 6 头 , 每 头 活 到 100 岁 , 而 且 都 能 进行 繁殖 的 话 , 那 么 750 年 以 后 ,一 对 
大 象 的 后 代 就 可 达到 1 900 万 头 。 因 此 ,按照 理论 上 的 计算 ,即便 繁殖 不 是 很 快 的 动 、 植 
物 ,也 会 在 不 太 长 的 时 期 内 产生 大 量 的 后 代 而 占 满 整个 地 球 。 但 事实 上 , 几 万 年 来 ,大 象 
的 数量 从 没有 增加 到 那样 多 。 自 然 界 里 很 多 生物 的 繁殖 能 力 都 远 远 超 过 大 象 , 但 各 种 生 
物 的 数量 在 一 定 的 时 期 内 都 保持 相对 的 稳定 状态 ,这 是 为 什么 呢 ? 达尔 文 想 到 了 生存 
竞争 。 

(2) 生存 竞争 。 生 物 的 繁殖 能 力 十 分 强大 ,但 每 种 生物 的 后 代 能 够 生存 下 来 的 却 很 
少 。 这 是 什么 原因 呢 ? 达尔 文 认 为 ,这 主要 是 过 度 繁 殖 引 起 的 生存 竞争 的 缘故 。 任 何 一 
种 生物 都 必须 为 生存 而 斗争 。 生 存 竞争 包括 生物 与 无 机 环境 之 间 的 斗争 .生物 的 种 内 斗 
争 ( 为 食物 .配偶 和 栖息 地 等 的 斗争 ) 以 及 生物 的 种 间 斗 争 。 生 存 竞 争 导 致 生物 大 量 死亡 ， 
只 有 少量 个 体 生存 下 来 。 那 么 在 生存 竞争 中 ,什么 样 的 个 体能 够 获胜 并 生存 下 去 呢 ? 达 
尔 文 用 遗传 和 变异 来 进行 解释 。 

(3) 遗传 和 变异 。 达 和 尔 文 认为 一 切 生 物 都 具有 产生 变异 的 特性 。 引 起 变异 的 根本 原 
因 是 环境 条 件 的 改变 。 在 生物 产生 的 各 种 变异 中 ,有 的 可 以 遗传 ,有 的 不 能 遗传 。 哪 些 变 
异 可 以 遗传 呢 ? 达尔文 用 适 者 生存 来 进行 解释 。 

(4) 适 者 生存 。 达 尔 文 认为 ,在 生存 竞争 中 ,具有 有 利 变异 的 个 体 ,容易 在 生存 竞争 
中 获胜 而 生存 下 来 。 反 之 ,具有 不 利 变 异 的 个 体 , 则 容易 在 生存 竞争 中 失败 而 死亡 。 也 就 
是 说 ,凡是 生存 下 来 的 生物 都 是 适应 环境 的 ,而 被 淘汰 的 生物 都 是 不 适应 环境 的 ,这 就 是 

达尔 文 把 在 生存 竞争 中 适 者 生存 \ 不 适 者 被 淘汰 的 过 程 叫 作 自然 选择 。 他 认为 ,自然 
选择 过 程 是 一 个 长 期 的 、 缓 慢 的 、 连 续 的 过 程 。 由 于 生存 竞争 不 断 进 行 ,因而 自然 选择 也 
是 不 断 进行 的 。 通 过 一 代 代 的 生存 环境 的 选择 作用 ,物种 变异 被 定向 地 朝 某 个 方向 积累 ， 
个 体 的 性 状 逐 渐 与 原来 的 祖先 有 所 不 同 ,如 此 一 来 ,新 的 物种 就 形成 了 。 由 于 生物 所 在 的 
环境 是 多 种 多 样 的 ,不 同 的 环境 会 筛选 出 有 不 同 特征 的 物种 ,因而 自然 选择 也 成 就 了 生物 
界 的 多 样 性 。 

尽管 达尔 文 的 自然 选择 学 说 只 揭示 了 生物 物种 的 适应 与 演化 原理 ,没有 涉及 物种 内 
部 的 有 机 体 自身 的 器 官 和 功能 的 进化 机 理 , 也 没 能 扩展 到 由 物种 组 成 的 生态 系统 的 动态 
平衡 机 制 。 但 是 作为 人 类 历史 上 第 一 个 成 功 的 进化 论 , 自然 选择 学 说 提出 的 变异 与 遗传 、 
自然 选择 、 适 者 生存 等 规律 ,给 科学 家 们 提供 了 无 限 的 启示 。 研 究 人 员 认 识 到 这 些 规 律 和 
基本 原理 也 可 应 用 到 其 他 科学 领域 ,于 是 很 多 具有 不 同 知识 背景 的 科学 家 把 达尔 文 的 进 
化 理论 推广 到 分 子 系统 ,物质 系统 .社会 经 济 系统 ,文化 系统 和 理论 系统 等 ,这 些 新 的 演化 
理论 可 称 为 广义 进化 论 或 广义 达尔 文 主义 。 

在 社会 经 济 系统 中 ,达尔 文 的 进化 论 既 受到 西方 经 济 学 的 影响 ,也 反 过 来 给 经 济 学 以 
极 大 的 启示 。 西 方 经 济 学 中 ,关于 市 场 经 济 存在 一 个 精妙 的 隐喻 一 一 看 不 见 的 手 ”, 它 和 
自然 选择 可 谓 异 曲 同 工 。 自 然 界 中 生物 存在 着 繁殖 过 剩 与 资源 和 环境 有 限 的 矛盾 ; 同 
样 ,市 场 经 济 条 件 下 个 人 和 企业 也 存在 欲望 无 限 与 资源 有 限 的 矛盾 。 自 然 界 中 生物 为 了 
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生存 和 繁殖 倾向 于 采取 自私 的 行为 ,但 在 同 种 生物 间 也 会 有 利他 行为 ; 同样 ,个 人 和 企业 
在 市 场 中 实现 自身 利益 最 大 化 的 同时 ,也 被 看 不 见 的 手 牵引 去 实现 公共 的 福利 。 自 然 选 
择 中 的 竞争 机 制 如 同一 只 看 不 见 的 手 , 通 过 一 系列 的 环境 变化 调节 着 整个 生物 圈 的 发 展 ， 
市 场 经 济 中 的 竞争 机 制 也 同样 具有 强大 的 协调 作用 。 

诺 贝尔 经 济 学 奖 获得 者 萨 缪 尔 森 有 上段 关于 竞争 机 制 的 经 典 定义 : 

它 是 一 个 精巧 的 机 构 , 通 过 一 系列 的 价格 和 市 场 ,发 生 无 意识 的 协调 作用 。 它 也 是 一 
个 传达 信息 的 机 器 ,把 千 百 万 不 同 个 人 的 知识 和 行动 汇合 在 一 起 。 虽 然 不 具有 统一 的 知 
力 , 它 却 解决 着 一 种 可 以 想象 到 的 牵涉 到 数 以 千 计 未 知 数 和 关系 的 最 复杂 的 问题 。 没 有 
人 去 设计 它 , 它 自然 而 然 演化 出 来 。 像 人 类 的 本 性 一 样 , 它 总 在 变动 。 但 是 , 它 经 受 了 任 
何 社会 组 织 的 最 基本 的 考验 一 一 它 可 以 生存 。 

然而 ,再 经 典 的 理论 也 会 存在 局 限 : 第 一 ,达尔 文 所 认定 的 演化 方式 是 渐进 式 的 ,不 
能 解释 由 于 随机 的 突变 而 导致 复杂 性 递增 的 结果 。 而 且 , 缓 慢 的 自然 选择 很 难 解释 在 连 
续 演 化 中 出 现 的 突然 飞跃 。 通 过 自然 选择 发 挥 作用 的 随机 突变 ,很 难 解释 已 知 物种 之 间 
连续 出 现 的 变种 。 第 二 ,经 过 一 些 科学 家 仔细 推荐 ,“ 自 然 选 择 、 适 者 生存 ”的 理论 其 实 是 
在 同 义 反复 : 最 适 者 是 指 留 下 最 多 后 代 者 ,生存 即 留 下 最 多 的 后 代 , 这 样 , 适 者 生存 变 成 
了 生存 者 生存 。 

但 瑕 不 掩 瑜 ,这 些 局 限 并 不 妨碍 学 者 们 将 进化 论 与 其 他 学 科 的 理论 进行 交叉 研究 。 
20 世纪 70 年 代 , 梅 纳 德 。 史 密斯 将 进化 生物 学 与 博弈 论 相 结合 ,不 仅 促进 了 进化 生物 学 
的 发 展 ,而 且 为 博弈 论 找到 了 最 佳 的 用 武之 地 。80 年 代 以 来 ,美国 学 者 E. 詹 奇 (Erich 
Jantsch) 运 用 耗 散 结构 理论 、 超 循环 理论 和 协同 学 等 自 组织 理 论 的 最 新 成 果 , 结 合 过 程 哲 
学 、 系 统 哲学 、 东 方 传统 哲学 乃至 佛教 的 宗教 哲学 思想 ,广泛 涉猎 从 宇宙 之 初 到 精神 现象 ， 
从 自然 演化 到 文化 进步 ,从 量子 跃迁 到 社会 动荡 ,从 物理 节律 到 全 息 学 说 等 领域 ,首次 提 
出 了 一 种 从 宇宙 演化 .生物 演化 .社会 文化 演化 和 精神 发 展 的 广义 综合 进化 论 一 一 自 组 织 
进化 论 。 欧 文 。 拉 效 洛 等 科学 家 所 做 的 广义 演化 研究 ,沟通 了 文化 传统 所 划 定 的 物理 世 
界 . 生 物 世 界 、 精 神 世 界 的 界限 ,为 物质 的 演化 .生命 的 演化 .文化 的 演化 和 知识 的 增长 提 
供 了 一 致 的 认识 。 众 多 学 者 构建 的 广义 进化 论 . 通 过 一 种 宏大 的 哲学 方法 论 体系 对 物理 
世界 、 生 物化 学 世界 、 人 类 世界 以 及 知识 系统 进行 了 综合 。 


7.2.2 演化 博弈 


在 同一 物种 的 群体 之 中 ,不 同 个 体 在 面 对 资 源 时 的 表现 往往 是 不 同 的 ,这 种 资源 可 能 
是 食物 、 住 所 或 者 配偶 。 不 同 个 体 的 表现 可 以 分 为 两 种 ,第 一 种 是 强硬 派 , 第 二 种 是 妥协 
派 。 当 博弈 的 双方 都 是 强硬 派 时 ,它们 会 一 直 争 斗 下 去 ,直至 一 方 重伤 或 死亡 。 当 一 方 是 
强硬 派 而 另 一 方 是 妥协 派 的 时 候 , 妥 协 派 会 选择 退出 ,而 强硬 派 获 得 资源 , 秃 应 对 腐肉 的 
争夺 就 是 这 种 情况 的 例证 。 如 果 两 方 都 是 妥协 派 , 则 会 一 直 僵持 下 去 ,直到 其 中 一 方 退 
出 ,这 时 双方 都 不 会 受伤 。 孔 省 通过 开 屏 来 争夺 配偶 就 属于 这 种 情况 。 
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生物 学 家 形象 地 把 生物 的 竞争 演化 过 程 称 为 应 铀 博弈 w。 让 我 们 以 赤 鹿 为 例 ,来 描 
述 雄 鹿 之 间 的 这 种 博弈 , 亦 即 竞争 演化 过 程 , 赤 鹿 之 间 的 争斗 如 图 7-3 所 示 。 


图 7-3 赤 鹿 之 间 的 争斗 


发 情 期 中 的 赤 鹿 常常 处 于 争斗 之 中 , 当 遇 到 配偶 ,大 战 一 触 即 发 。 但 此 时 ,不 同 的 赤 
鹿 会 采取 不 同 的 策略 : 采取 钥 策 略 的 赤 鹿 将 会 史 哮 ,而 采取 应 策略 的 赤 鹿 则 会 直接 出 击 
( 锁 住 鹿角 或 彼此 进行 身体 搏斗 )。 这 场 争 斗 将 以 其 中 一 方 受伤 并 退出 而 告终 ,胜利 的 一 
方 会 获得 资源 。 假 设 资源 总 量 为 30。 那 么 , 鹿 群 之 间 的 博弈 将 会 出 现 以 下 三 种 情况 。 

(1) 一 只 强硬 派 的 赤 鹿 和 一 只 受 协 派 的 赤 鹿 争斗 ,强硬 派 将 会 获得 资源 。 因 为 当 强 
硬派 的 赤 鹿 通过 锁 住 鹿角 的 方式 进行 争斗 时 , 受 协 派 就 会 退缩 放弃 ,强硬 派 的 赤 鹿 就 获得 
了 全 部 资源 , 即 30, 而 妥协 派 只 获得 0。 

(2) 两 只 赤 鹿 都 是 妥协 派 , 它 们 会 长 时 间 处 于 争斗 状态 ,直到 其 中 一 只 放弃 为 止 。 如 
果 我 们 假定 每 一 方 都 有 50% 的 概率 坚持 的 时 间 比 对 方 长 , 当 两 方 争 斗 时 ,期 望 就 是 
15(30/2) 。 

(3) 两 只 强硬 派 的 赤 鹿 决斗 时 ,争斗 持续 直到 其 中 一 
只 受伤 。 失 败 者 就 是 一 40, 而 争斗 中 的 胜利 者 就 获得 了 
资源 ,得 到 30。 当 两 只 强硬 派 博弈 .他们 获胜 的 概率 都 是 
50% ,那么 它们 的 期 望 就 是 一 5[(30 一 40)/2]。 

应 铅 博 弈 的 结果 如 图 7-4 所 示 。 

对 于 采取 不 同 策略 的 赤 鹿 而 言 , 其 获得 的 数值 越 高 ， 图 7-4 座 鲍 博弈 的 结果 


Q@ 在 英语 文化 中 , 鹰 代表 强 者 .强势 , 钥 代 表 妥 协 . 求 和 。 在 政治 党 派 中 ,会 有 谭 派 和 铀 派 的 区 别 。 鹰 派 一 般 会 
用 于 形容 主张 采取 强势 外 交手 段 或 积极 军事 扩张 的 人 士 、 团 体 或 势力 ,或 被 解释 为 以 强硬 态度 或 手段 维护 国家 民族 利 
益 的 个 人 、 团 体 或 势力 。 而 钥 派 主要 用 于 形容 主张 采取 柔性 温和 的 态度 及 手段 处 理 外 交 、 军 事 等 问题 的 人 士 ` 团 体 或 
势力 。 
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越 容易 存活 下 来 。 

我 们 假定 赤 鹿 群 足够 庞大 ,也 就 是 它 自 己 在 群体 中 所 占 的 百分比 几乎 为 零 , 且 其 中 同 
时 存在 强硬 派 和 妥协 派 。 首 先 ,如 果 强 硬派 和 妥协 派 的 比例 为 1: 1, 则 采取 强硬 派 赤 鹿 
的 期 望 得 益 是 

一 5X0.5 十 30X0.5 一 12.5 
而 此 时 妥协 派 赤 鹿 的 期 望 得 益 是 
0X0.5 十 15X0.5 王 7.5 

妥协 派 的 期 望 值 低 于 强硬 派 , 此 时 强硬 派 在 群体 中 占据 优势 ,继续 扩大 规模 。 

那么 在 什么 情况 下 强硬 派 和 妥协 派 将 会 达到 平衡 , 即 期 望 得 益 相 同 呢 ? 

设 群体 中 强硬 派 的 比例 为 p, 则 妥协 派 的 比例 为 1 一 p。 如 果 期 望 得 益 相等 , 则 有 

—5p+30X(1—p)=0xp+15x (1—p) 

可 以 解 得 群体 达到 平衡 的 比例 为 3 : 1, 即 强硬 派 占 比 75% ,妥协 派 占 比 25%。 

假如 群体 中 的 雄 鹿 全 部 采取 同一 种 策略 , 即 全 是 强硬 派 ,或 者 全 是 妥协 派 ; 而 这 时 突 
然 产生 了 变异 , 即 强硬 派 群 体 中 产生 了 妥协 派 个 体 ,妥协 派 群体 中 产生 了 强硬 派 个 体 , 那 
么 种 群 将 会 如 何 演变 ? 

(1) 原始 群体 全 是 强硬 派 。 此 时 强硬 派 的 占 比 为 100%。 强 硬派 的 期 望 得 益 值 为 一 5， 
而 妥协 派 的 期 望 得 益 值 为 0。 此 时 妥协 派 期 望 得 益 值 更 高 ,成 功 完成 人 侵 。 

(2) 原始 群体 全 是 妥协 派 。 此 时 妥协 派 的 占 比 为 100%。 强 硬派 的 期 望 得 益 值 为 
30 ,而 妥协 派 的 期 望 得 益 值 为 15。 此 时 强硬 派 的 期 望 得 益 值 更 高 ,成 功 完成 人 侵 。 

完成 和 侵 后 的 个 体会 不 断 扩大 数量 ,直到 达到 平衡 比例 (强硬 派 : 妥协 派 二 3 : 1) 。 

可 以 看 出 ,采用 单一 策略 的 群体 并 不 是 稳定 的 群体 。 如 何 才能 达到 群体 的 稳定 , 意 即 
找到 一 种 稳定 的 策略 均衡 呢 ? 这 就 是 演化 博弈 所 要 解决 的 问题 ,也 是 下 文 的 主要 内 容 。 
在 介绍 演化 博弈 的 均衡 概念 之 前 , 先 来 定义 什么 是 演化 博弈 。 

定义 7.1( 演 化 博弈 ) 将 博弈 分 析 方法 和 动态 演化 过 程 分 析 结 合 起 来 ,针对 某 个 随 
着 时 间 变 化 的 有 限 理 性 的 群体 ,研究 从 个 体 行 为 到 群体 行为 的 形成 机 制 以 及 其 中 涉及 的 
各 种 因素 ,分 析 群 体 演化 的 动态 过 程 ,解释 说 明 群 体 将 达到 何 种 稳定 状态 (通常 是 动态 的 
均衡 ) 以 及 如 何 达 到 ,我 们 将 这 样 的 问题 模型 称 为 演化 博弈 。 

演化 博弈 总 是 在 特定 的 博弈 结构 和 规则 下 进行 的 ,特定 的 技术 和 制度 条 件 决定 了 特 
定 的 博弈 结构 与 规则 。 接 下 来 简要 解释 演化 博弈 所 涉及 的 一 些 概念 。 

(1) 有 限 理性 。 与 经 典 博弈 不 同 的 是 ,演化 博弈 认为 参与 者 并 不 拥有 博弈 结构 和 规 
则 的 全 部 知识 , 即 参 与 者 的 知识 是 相当 有 限 的 。 这 点 已 经 在 7.1 节 阐 述 过 。 而 且 , 参 与 者 
通常 通过 某 种 传递 机 制 而 非 理 性 选择 获得 策略 。 尽 管 博弈 的 次 数 可 能 是 无 穷 的 ,但 是 在 
每 次 博弈 中 参与 者 都 是 从 大 群体 中 被 随机 选取 的 ,彼此 缺乏 了 解 ,再 次 参与 博弈 的 概率 也 
较 低 。 因 此 ,参与 者 不 会 像 在 重复 博弈 中 那样 尝试 通过 声誉 机 制 来 影响 对 方 未 来 的 行动 。 

在 演化 博弈 中 ,参与 者 对 于 经 济 规律 或 某 种 成 功 的 行为 规则 .行为 策略 的 认识 是 在 演 
化 的 过 程 中 得 到 不 断 的 修正 和 改进 的 (也 可 称 为 “ 试 错 ”) ,成 功 的 策略 被 模仿 ,进而 产生 出 
一 般 的 “规则 ”和 “制度 "作为 行为 主体 的 行动 标准 。 在 这 些 一 般 规则 下 ,行为 主体 获得 “ 满 
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意 "的 收益 。 
(2) 适应 度 函 数 。 在 进化 论 中 ,适应 度 指 某 一 基因 型 个 体 与 其 他 基因 型 个 体 相 比 时 
能 够 存活 并 留 下 后 代 的 能 力 ,通常 假定 其 值 在 0 到 1 之 间 。 适 应 度 是 生物 进化 论 的 核心 
念 , 它 描述 的 是 基因 的 繁殖 能 力 。 演 化 博弈 必须 将 经 典 博弈 中 的 支付 函数 转化 为 适应 
度 函 数 ,而 适应 度 函 数 则 可 视 为 策略 与 适应 度 的 映射 关系 。 在 演化 博弈 模型 中 , 某 种 策略 
的 适应 度 可 简单 理解 为 采用 该 策略 的 人 数 在 每 期 博弈 后 的 增长 率 。 

为 简化 分 析 ,许多 演化 博弈 模型 都 直接 将 个 体 的 博弈 支付 等 同 于 适应 度 , 而 非 0 到 1 
之 间 。 

一 般 来 讲 , 某 种 策略 的 适应 度 不 仅 取决 于 它 在 博弈 中 获取 的 支付 ,还 取决 于 特定 社会 
文化 背景 下 人 们 对 该 策略 的 各 种 主观 道德 评价 ,以 及 个 体 对 该 策略 的 学 习 能 力 和 个 体 间 
的 社会 互动 模式 。 由 于 参与 者 是 随机 挑选 的 , 某 个 纯 策 略 的 适应 度 取决 于 该 策略 的 期 望 
得 益 ,后 者 又 依赖 于 策略 组 合 的 频率 分 布 。 因 此 ,适应 度 函 数 是 策略 依赖 的 。 此 外 ,适应 
度 函 数 有 时 还 依赖 于 群体 规模 。 

(3) 演化 过 程 。 选 择机 制 和 变异 机 制 。 演 化 博弈 有 别 于 传统 博弈 的 重要 特征 之 一 
是 , 它 着 重 考 察 了 群体 规模 和 策略 频率 的 演化 过 程 。 演 化 博弈 的 演化 过 程 主要 包含 两 个 
机 制 : 变异 机 制 和 选择 机 制 。 演 化 过 程 也 可 笼统 地 称 为 演化 机 制 。 与 传统 达尔 文 主义 类 
似 , 演 化 博弈 也 不 深入 考察 遗传 机 制 ,通常 简单 假定 遗传 是 通过 无 性 生殖 传递 的 ,后 代 拥 
有 与 祖先 相同 的 策略 。 由 于 将 适应 度 视 为 个 体 生产 后 代 的 数量 ,复制 过 程 (或 遗传 过 程 ) 
实际 上 与 选择 过 程 是 同一 个 过 程 。 这 种 复制 与 选择 相互 重合 的 过 程 也 充分 体现 在 7. 3.2 
节 的 复制 者 动态 模型 中 。 而 且 , 尽 管 演化 博弈 也 强调 变异 机 制 的 重要 性 ,但 它 的 变异 机 制 
是 相当 有 限 的 ,主要 指 在 既定 策略 空间 中 个 体 策略 的 随机 变动 ,并 不 包含 新 策略 的 产生 。 
研究 普遍 认为 ,在 演化 博弈 中 ,变异 机 制 主要 是 为 了 检验 演化 均衡 的 稳定 性 。 因 此 ,演化 
博弈 对 演化 过 程 的 建 模 主 要 依赖 于 选择 机 制 。 复 制 者 动态 是 一 种 典型 的 基于 选择 机 制 的 
确定 性 和 非 线性 的 演化 博弈 模型 。 在 此 模型 中 加 入 策略 的 随机 变动 ,就 构成 了 一 个 包含 
选择 机 制 和 变异 机 制 的 综合 演化 博弈 模型 ,通常 被 称 为 复制 者 -变异 者 模型 。 

值得 一 提 的 是 ,并 非 所 有 的 概念 都 可 以 跨 界 延伸 ,演化 博弈 理论 中 的 一 些 生物 进化 的 
概念 ,如 性 别 和 交配 、 染 色 体 和 代 际 等 ,就 很 难 被 引入 经 济 学 领域 中 来 。 演 化 博弈 理论 在 
经 济 学 领域 的 应 用 主要 是 考虑 微观 个 体 在 演化 的 过 程 中 可 以 学 习 和 模仿 其 他 个 体 的 行 
为 , 即 沿用 拉 马 克 的 遗传 基因 理论 。 


LE 扩展 阅读 : 演化 博弈 论 的 演化 


普遍 认为 ,演化 博弈 理论 的 形成 和 发 展 大 致 经 历 三 个 阶段 : 

首先 , 当 博 弈 论 在 经 济 学 中 广泛 运用 时 ,生物 学 家 从 中 得 到 启示 ,尝试 运用 博弈 论 中 
的 策略 互动 思想 建构 各 种 生物 竞争 演化 模型 ,包括 动物 竞争 、 性 别 分 配 以 及 植物 的 成 长 和 
发 展 等 。 这 个 阶段 实际 上 是 博弈 论 在 生物 学 中 的 运用 。 

接着 ,生物 学 家 根据 生物 演化 的 自身 规律 ,对 传统 博弈 论 进行 改造 ,包括 将 传统 博弈 
论 中 支付 函数 转化 为 生物 适应 度 函 数 、 引 入 突变 机 制 将 传统 的 纳什 均衡 精炼 为 演化 稳定 
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均衡 ,引入 选择 机 制 构建 复制 者 动态 模型 ,这 个 阶段 是 演化 博弈 正式 形成 阶段 。 

随后 ,鉴于 演化 博弈 对 传统 博弈 的 拓展 (如 放松 理性 假设 、 精 炼 纳什 均衡 以 及 考察 动 
态 调整 过 程 ) ,经济 学 家 又 反 过 来 借鉴 生物 学 家 的 思想 ,将 演化 博弈 运用 到 经 济 学 中 , 进 一 
步 推动 演化 博弈 的 发 展 ,包括 从 演化 稳定 均衡 发 展 到 随机 稳定 均衡 ,从 确定 性 的 复制 者 动 
态 模型 发 展 为 随机 的 个 体 学 习 动 态 模 型 等 。 

实际 上 ,演化 博弈 的 思想 还 可 以 追溯 到 约翰 ， 纳 什 对 均衡 概念 的 阐释 。 纳 什 曾 指出 ， 
均衡 概念 存在 两 种 解释 方式 : 一 种 是 理性 主义 的 解释 ; 另 一 种 是 “大 规模 行动 的 解释 ”。 
前 一 种 是 经 典 博弈 论 的 解释 方式 ,后 一 种 实际 上 是 演化 博弈 的 解释 方式 。 纳 什 认为 均衡 
的 实现 并 不 一 定 要 假设 参与 者 对 博弈 结构 拥有 全 部 知识 ,以 及 个 体 拥 有 复杂 的 推理 能 力 。 
只 要 假设 参与 者 在 决策 时 能 够 从 具有 相对 优势 的 各 种 纯 策 略 中 积累 相关 经 验 信息 (如 学 
习 得 益 高 的 策略 ) ,经 过 一 段 时间 的 策略 调整 ,也 能 达到 均衡 状态 。 因 此 ,演化 博弈 的 思想 
早 就 存在 于 纳什 的 博弈 理论 中 。 

尽管 如 此 ,纳什 并 不 是 最 早 提出 演化 博弈 思想 的 学 者 。 事 实 上 ,演化 博弈 的 发 展 主要 
是 由 众多 优秀 的 博弈 论 学 者 推动 的 。 现 在 已 很 难 考证 纳什 的 “大 规模 行动 ”是 否 受 到 生物 
学 家 的 影响 。 但 是 ,我 们 却 可 以 在 许多 更 早 的 生态 模型 和 生物 群体 模型 中 清晰 地 发 现 演 
化 博弈 思想 。 只 要 建立 各 种 演化 策略 与 适应 度 和 群体 增长 率 的 关系 ,上 述 这 些 群体 动态 
模型 都 可 以 被 转化 为 演化 博弈 模型 。 学 者 们 进一步 指出 ,演化 博弈 的 核心 思想 早 就 存在 
于 达尔 文 的 自然 选择 理论 中 ,可 以 将 其 称 为 达尔 文 主义 博弈 。 因 此 ,演化 博弈 的 兴起 既 受 
到 博弈 论 的 影响 ,也 受到 生物 演化 的 影响 。 它 不 仅 属于 博弈 论 的 研究 范畴, 还 属于 生物 演 
化 理论 的 研究 范畴 。 


7.2.3 演化 稳定 策略 


第 一 节 ,我 们 完成 了 对 理性 的 讨论 ,了 解 了 完全 理性 难以 实现 ,大 多 数 人 是 有 限 理性 
的 。 第 二 节 ,我 们 通过 常见 的 应 铝 博 弈 导出 了 演化 博弈 的 概念 ,并 由 此 提出 了 演化 博弈 的 
适应 度 函 数 和 选择 机 制 。 现 在 我 们 将 对 演化 博弈 中 最 重要 的 概念 之 一 一 一 演化 稳定 策略 


进行 讨论 。 
假设 在 一 个 群体 中 ,存在 强硬 派 和 妥协 派 两 个 派别 .每 个 个 体 既 有 可 能 成 为 强硬 派 ， 
也 有 可 能 成 为 妥协 派 。 假 设 赤 鹿 1 的 混合 策略 为 a 
(p11 一 p1), 即 赤 鹿 1 有 pl 的 概率 成 为 强硬 派 , 有 强硬 p， 妥协 (1-p) 
1 一 户 的 概率 成 为 妥协 派 ; 杰 魔 2 的 混合 策略 为 Wi 
(pz ,1 一 户 ), 即 赤 放 2 有 ps 的 概率 成 为 强硬 派 有 。” 赤 唐 1 
1 一 ps 的 概率 成 为 妥协 派 。 赤 鹿 博 蛮 如 图 7-5 22) 
所 示 。 图 7-5 赤 鹿 博弈 
那么 诈 群 博弈 中 存在 4 种 情况 : 
(1) 当 赤 鹿 1 和 赤 庆 2 都 是 强硬 派 时 , 赤 诞 1 的 得 益 是 一 5, 这 种 情况 的 发 生 的 概率 
是 pi1X pz。 


(2) 当 赤 鹿 1 是 强硬 派 , 而 赤 鹿 2 是 妥协 派 时 , 赤 鹿 1 的 得 益 为 30, 这 种 情况 发 生 的 
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概率 是 pi X (1 一 p2)。 
(3) 当 赤 鹿 1 是 妥协 派 , 而 赤 鹿 2 是 强硬 派 时 , 赤 鹿 1 的 得 益 为 0, 这 种 情况 发 生 的 概 
率 是 (1 一 p1) Xp2。 
(4) 赤 鹿 1 和 赤 鹿 2 都 是 妥协 派 , 则 赤 鹿 1 的 得 益 为 15, 这 种 情况 发 生 的 概率 是 (1 一 
p1)X(1—p2)。 
则 赤 鹿 1 的 期 望 得 益 为 
F(p1i,p2) =p1 X pz X(—5)++p1iX (1—pz) X30+ 1m—p1) xX pz XO++ 
(1—pi)X(—p2) X15 《和 
现在 开始 , 需 将 上 述 具 体例 子 推广 到 一 般 的 符号 描述 ,然后 再 回 到 数值 例子 进行 
解释 。 
假设 群体 中 大 部 分 成 员 都 有 p 的 概率 成 为 强硬 派 ,(1 一 p) 的 概率 成 为 妥协 派 , 即 大 部 
分 成 员 采 取 的 混合 策略 为 (p,1 一 p); 另外 有 一 小 部 分 突变 体 ,采取 新 的 混合 策略 (g ,1 一 gq)， 
即 对 这 小 部 分 变异 体 来 说 ,他 们 有 g 的 概率 成 为 强硬 派 , 有 (1 一 9) 的 概率 成 为 妥协 派 。 我 
们 用 F(x,y) 表 示 采 取 混 合 策略 (zx,1 一 x) 的 参与 者 1 在 与 采取 混合 策略 (y,1 一 y) 的 参与 
者 2 进行 博弈 之 后 的 期 望 得 益 D。 假 设 突变 体 的 数量 在 整个 群体 中 的 占 比 为 e(e 远 远 小 
于 1, 记 作 e<1)。 
那么 ,原始 群体 采取 p 策略 2 得 到 的 期 望 适应 值 为 
(1—e)XF(p,p)+eXF(p,g) 72 
这 只 赤 鹿 遇见 和 它 采取 同 策略 的 概率 为 1 一 e, 遇 见 突变 体 采取 gq 策略 的 概率 为 e。 
突变 体 采取 混合 策略 g 得 到 的 期 望 适应 值 为 
(1 一 e) XF(g,p)+eX F(g,g) (7-3) 
如 果 原 始 群体 能 够 抵御 突变 体 , 就 需要 满足 式 (7-2) 的 期 望 值 大 于 式 (7-3) 的 期 望 
值 , 即 


(1—e)XF(p,p)+eXF(p,g)> (1—e) XF(g,p)+e XxX F(g,g) (7-4) 
当 。 无限 接近 于 0 时 (突变 体 所 占 的 比例 非常 小 ) , 式 (7-4) 就 等 同 于 
F(p,p) > Fl(q,p) K7=8 
也 就 是 说 ,如 果 F(p,p) 记 Fl(q,p) ,那么 在 一 小 部 分 突变 体 采取 策略 q 的 情况 下 ,采取 
策略 的 群体 是 稳定 的 ,突变 个 体会 被 淘汰 。 反 之 ,如 果 F(p.p) 二 Fl(g,p), 那 么 采取 策略 
p 的 群体 就 很 容易 被 突变 体 扰乱 ,突变 个 体 将 存活 下 来 。 
如 果 F(p,p) 二 Fl(g,p) 会 发 生 什么 情况 ?” 当 FF(p,p) 二 Flg,p) 时 ,不 等 式 (7-4) 可 以 
化 简 为 
F(p.qg) > F(g,g) 
上 式 表示 ,如 果 采 取 p 策略 的 原始 群体 中 的 成 员 与 男 一 个 原始 个 体 合 处 的 适应 值 等 


@ 这 里 强调 F(Cz,y) 始 终 表示 前 者 的 期 望 得 益 , 即 成 为 强硬 派 的 概率 为 x 的 参与 者 1 的 得 益 。 
回 ”简便 起 见 ,我 们 用 策略 表示 混合 策略 (p, 1 一) , 即 该 个 体 成 为 强硬 派 的 概率 是 p, 成 为 妥协 派 的 概率 是 
lp. 
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于 突变 个 体 与 原始 个 体 混 处 的 适应 值 ,那么 要 使 原始 个 体 对 突变 个 体 具有 人 免疫 力 ,就 必须 
要 求 原始 个 体 与 突变 个 体 混 处 的 适应 值 大 于 突变 个 体 与 突变 个 体 合 处 的 适应 值 。 尽 管 遇 
见 突变 体 的 概率 很 小 ,但 不 可 小 舰 ,它们 决定 了 采取 p 策略 或 采取 g 策略 的 相对 优势 。 
综 上 所 述 , 当 群体 满足 以 下 两 个 条 件 之 一 时 ,原始 群体 可 以 抵抗 变异 体 的 扰乱 , 即 保 
持 群 体 的 稳定 性 。 
(1) F(p,p)>F(g,p).。 
(2) F(p,p)=F(g,p) 但 F(p,q)>F(g,g), 
条 件 (1) 和 条 件 (2) 其 实 就 是 应 铀 博弈 的 演化 稳定 策略 。 一 般 来 讲 , 条 件 (1) 更 强 一 些 。 
针对 一 般 情况 ,我 们 给 出 演化 稳定 策略 的 正式 定义 。 
定义 7.2( 演 化 稳定 策略 ) 对 于 所 有 的 策略 g 隆 p ,如果 F(p,p)F(g,p), 那 么 策略 
就 是 强 演化 稳定 策略 ( 强 ESS); 如 果 F(Pp.p)=F(Cdq, 站 ) 且 下 (pq) 二 FCq,q) ,那么 策略 
户 就 是 弱 演 化 稳定 策略 ( 弱 ESS) 。 
定义 7.2 的 含义 是 ,为 了 使 采取 p 策略 的 个 体 遇 到 采取 g 策略 的 突变 体 时 可 以 保持 
稳定 ,需要 满足 以 下 两 个 条 件 中 的 一 个 : 当 遇 见 参 与 者 采取 p 策略 时 ,采取 pp 策略 得 到 
的 适应 值 FR(p,p) 需 要 高 于 采取 g 策略 得 到 的 适应 值 F(g,p)( 强 ESS); 回 当 遇 到 的 参与 
者 采取 p 策略 时 ,采取 p 策略 得 到 的 适应 值 下 (p,p) 等 于 采取 g 策略 得 到 的 适应 值 F(g， 
Pp); 与 此 同时 , 当 遇 见 的 参与 者 是 采取 策略 时 ,采取 p 策略 得 到 的 适应 值 政 (p,q) 需要 
高 于 采取 9 策略 得 到 的 适应 值 F(dq,q)( 弱 ESS)。 需 提请 注意 的 是 ,均衡 条 件 必须 对 所 有 
的 策略 4 都 成 立 , 意 即 无 论 突变 个 体 采 取 什 么 策略 都 是 如 此 。 满 足 这 些 条 件 的 策略 就 被 
称 为 演化 稳定 策略 。 
接 下 来 ,到 具体 事例 ,以 雄 鹿 之 间 的 博弈 为 例 介 绍 寻 找 演化 稳定 策略 的 过 程 和 
方法 。 
首先 ,寻找 强 演 化 稳定 策略 。 任 给 突变 策略 g, 利 用 强 ESS 的 条 件 来 确定 是 否 存 在 p 
值 使 得 
F(p,p)>F(g.p) (pq) 
代入 表达 式 (7-1), 上 式 即 为 
prX(—5)+pX(1l—p)X30+1—p) XpXO++1—p): X15> 
pxXqx(—5)+qxXl—pX0+—o) XpxXo0+—WDXI—D)XI15 (gq 
(7-6) 
化 简 后 可 得 
(p= xLsx=5 
假定 方 括号 中 的 项 为 正 值 ,那么 
条 件 式 (7-7) 也 不 成 立 。 
因此 ,并 不 存在 某 个 p 值 ,使 得 条 件 式 (7-7) 对 所 有 的 g 关 p 都 成 立 。 所 以 ,该 博弈 不 
存在 强 演化 稳定 策略 。 
其 次 ,考虑 弱 演 化 稳定 策略 的 条 件 。 通 过 分 析 条 件 式 (7-7) 可 知 ,要 使 F(p,p) 王 
F(q,p) 对 所 有 的 q 隆 Pp 成 立 , 条 件 式 (7-7) 左 边 须 等 于 0. 方 括号 内 的 项 必须 为 0, 即 


) 


+H01—p)xX30—(1—p)xX15]>0 (7-7) 
当 g 二 p 时 .条 件 式 (7-7) 不 成 立 ; 否则 , 当 gq 二 p 时 ， 
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访 X (一 5) 十 (1 一 户 ) X30 一 (1 一 加 X15 王 0 (7-8) 
可 以 解 出 p 二 0. 75。 它 满足 弱 演 化 稳定 策略 的 第 一 个 条 件 式 , 是 弱 演 化 稳定 策略 的 备 
选 值 。 
弱 演 化 稳定 策略 的 第 二 个 条 件 式 是 
F(p,g) >> Fl(g,g), gp (7=9) 


代入 式 (7-1) 可 知 : 
( 诗 )x (0.75 一 ?>0， dg 天 0.75 (7-10) 


条 件 式 (7-10) 对 所 有 4 天 0. 75 都 是 成 立 的 。 
因此 ,混合 策略 (0. 75 ,0. 25) 是 鹿 群 博弈 的 弱 演 化 稳定 策略 。 换 言 之 , 当 鹿 群 中 的 原 
始 群 体 有 0. 75 的 概率 成 为 强硬 派 , 有 0. 25 的 概率 成 为 妥协 派 时 , 鹿 群 达到 一 个 稳定 的 均 
衡 , 可 以 抵抗 突变 体 的 干扰 ,持续 发 展 下 去 。 


W 进 阶 阅读 : 演化 稳定 策略 与 纳什 均衡 ,演化 均衡 的 关系 


1. 演化 稳定 策略 与 纳什 均衡 的 关系 

如 果菜 一 策略 对 侵入 或 突变 具备 了 免疫 力 , 那 么 群体 可 利用 该 策略 来 保持 稳定 ,这 一 
策略 即 为 演化 稳定 策略 。 然 而 ,也 许 有 读者 会 问 : 图 7-5 所 对 应 的 静态 博弈 本 来 就 存在 
一 个 混合 策略 纳什 均衡 而 且 稳定 , 它 与 演化 稳定 策略 究竟 有 何 关系 呢 ? 

首先 ,需要 明确 一 点 ,纳什 均衡 是 一 个 策略 组 合 , 而 演化 稳定 策略 是 一 个 策略 。 因 此 ， 
在 比较 纳什 均衡 与 演化 稳定 策略 时 ,常常 假定 静态 博弈 中 的 纳什 均衡 是 对 称 的 , 即 所 有 个 
体 都 采用 相同 的 策略 。 此 时 将 对 称 纳 什 均衡 策略 与 演化 稳定 策略 进行 比较 才 有 意义 。 

其 次 ,这 两 种 均衡 策略 对 应 着 两 种 不 同 的 策略 选择 机 制 。 纳 什 均衡 策略 对 应 向 前 看 
的 选择 机 制 ,而 演化 稳定 策略 对 应 着 演化 机 制 。 挨 言 之 ,前 者 由 理性 参与 者 选择 最 优 策 
略 ,从 而 产生 最 大 的 适应 值 ,而 后 者 则 通过 自然 选择 机 制 来 获得 最 高 的 适应 值 。 通 常 , 在 
完全 理性 的 假设 下 ,如 果 纳 什 均衡 存在 ,那么 参与 者 博弈 一 次 就 可 直接 达到 纳什 均衡 。 这 
个 结果 不 依赖 于 参与 者 所 处 的 初始 状态 ,所 以 不 需要 任何 的 动态 调整 过 程 。 而 演化 博弈 
论 则 认为 ,纳什 均衡 的 达到 应 当 是 在 多 次 博弈 后 才能 达到 的 ,需要 有 一 个 动态 的 调整 过 
程 ,均衡 地 达到 依赖 于 初始 状态 ,是 路 径 依 赖 的 。 关 于 演化 均衡 的 状态 依赖 性 ,在 7. 3.2 
节 中 将 有 例证 。 

最 后 ,这 两 种 策略 并 非 完全 一 致 。 本 书 略 去 相关 证 明 , 仅 给 出 一 些 结论 。 

结论 1: 演化 稳定 策略 是 纳什 均衡 策略 ,但 纳什 均衡 策略 不 一 定 是 演化 稳定 策略 。 

现 就 这 一 结论 稍 作 解释 。 在 有 多 个 纳什 均衡 的 情况 下 ,若菜 个 纳什 均衡 一 定 会 被 采 
用 时 ,必须 存在 有 某 种 能 够 导致 每 个 参与 者 都 预期 到 的 某 个 均衡 出 现 的 机 制 。 然 而 ,博弈 
论 中 的 纳什 均衡 概念 本 身 却 不 具有 这 种 机 制 。 因 此 , 当 博 弈 存在 多 个 纳什 均衡 时 ,即使 假 
设 参 与 者 都 是 完全 理性 的 ,也 无 法 预测 博弈 的 结果 是 什么 ,如 果 参 与 者 只 有 有 限 理 性 ,就 
更 难 预测 博弈 的 结果 了 。 而 在 演化 博弈 理论 中 ,均衡 的 精炼 通过 前 向 归纳 法 来 实现 , 即 参 
与 人 根据 博弈 的 历史 来 选择 其 未 来 的 行为 策略 ,是 一 个 动态 的 选择 及 调整 过 程 。 因 此 , 尽 
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管 参 与 人 都 是 有 限 理 性 的 ,但 动态 的 选择 机 制 将 使 得 在 有 多 个 纳什 均衡 存在 的 情形 下 达 
到 其 中 的 某 一 个 纳什 均衡 ,实现 纳什 均衡 的 精炼 。 

总 而 言 之 ,演化 稳定 策略 是 比 纳什 均衡 更 精炼 的 概念 。 就 是 说 ,一 种 策略 成 为 演化 稳 
定 策略 比 成 为 纳什 均衡 需要 满足 更 多 的 条 件 。 从 某 种 意义 上 说 ,演化 稳定 策略 是 纳什 均 
衡 附 加 一 个 稳定 条 件 , 这 个 条 件 能 保证 群体 在 小 的 冲击 下 不 被 侵入 的 稳定 状态 。 

那么 ,在 什么 情况 下 纳什 均衡 策略 并 非 演化 稳定 策略 呢 ? 答案 有 些 复杂 ! 一 个 相对 
简单 的 回答 是 , 当 一 个 对 称 纳什 均衡 所 对 应 的 策略 是 弱 劣 策略 时 , 它 一 定 不 是 演化 稳定 
策略 。 

但 是 ,对 于 一 个 对 称 的 严格 纳什 均衡 而 言 ,每 个 参与 者 所 选择 的 策略 都 是 最 优 策略 ， 
从 而 使 其 他 参与 者 获得 一 个 较 低 的 得 益 。 因 此 ,满足 强 演化 稳定 策略 的 条 件 和 (对 称 ) 严 
格 纳什 均衡 的 条 件 是 等 价 的 。 因 此 有 下 述 结论 。 

结论 2: 一 个 严格 对 称 纳什 均衡 是 演化 稳定 策略 。 

2. 演化 均衡 与 上 述 演化 均衡 和 纳什 均衡 的 关系 

除了 纳什 均衡 外 , 另 一 个 与 演化 稳定 策略 相近 但 不 同 的 概念 是 演化 均衡 。 荷 什 勒 佛 
(Hirshleifer) 在 1982 年 提出 了 演化 均衡 的 概念 。 按 照 荷 什 勒 佛 的 概念 , 若 从 某 平衡 点 的 
任意 小 邻 域 内 出 发 的 轨 线 最 终 都 演化 趋向 于 该 点 , 则 称 该 点 是 局 部 渐 近 稳定 的 ,这 样 的 动 
态 稳定 平衡 点 就 是 演化 均衡 。 演 化 均衡 与 演化 稳定 策略 、 纳 什 均衡 之 间 的 关系 如 下 。 

(1) 每 一 个 纳什 均衡 都 是 动态 系统 的 平衡 点 ,但 并 不 是 每 个 平衡 点 都 是 演化 均衡 。 

(2) 演化 均衡 一 定 是 纳什 均衡 。 

(3) 演化 稳定 策略 不 一 定 是 演化 均衡 。 具 体 而 言 ,复制 者 动态 机 制 可 以 保证 演化 稳 
定 策略 为 演化 均衡 ,但 在 一 般 的 演化 机 制 中 演化 稳定 策略 却 既 不 是 演化 均衡 的 充分 条 件 
也 不 是 演化 均衡 的 必要 条 件 。 

根据 弗 里 德 曼 的 观点 ,演化 博弈 论 中 最 为 有 用 、 运 用 最 为 广泛 的 均衡 概念 并 不 是 演化 
稳定 策略 ,而 是 演化 均衡 一 一 因为 行为 按照 某 种 动态 随时 间 变 化 的 假设 是 合乎 情理 的 。 


7.3 两 种 常见 的 演化 机 制 ” 


演化 博弈 分 析 的 关键 是 确定 参与 者 学 习 和 策略 调整 的 模式 , 亦 即 演化 机 制 。 由 于 参 
与 者 理性 层次 的 多 样 性 ,使 得 参与 者 的 学 习 和 策略 调整 的 方式 与 速度 相差 其 远 ?。 要 对 
演化 博弈 做 出 有 效 的 分 析 预 测 ,必须 发 展 适 合 不 同 参与 者 的 演化 机 制 ,分 析 各 种 机 制 的 稳 
定性 ,以 及 用 不 同 的 机 制 来 模拟 参与 者 的 策略 调整 过 程 。 

如 前 所 述 , 人 类 的 竞争 与 合作 行为 实际 上 跟 动 物 世 界 很 相似 ,借鉴 研究 生物 行为 规律 
的 研究 方法 来 分 析 人 类 的 行为 是 可 行 的 。 生 物 进化 中 生物 性 状 和 行为 特征 动态 变化 过 程 
的 “复制 者 动态 ”, 正 是 模拟 参与 者 学 习 和 调整 策略 过 程 的 重要 机 制 之 一 ,而 生物 进化 论 所 


@ 不 仅 不 同 博弈 的 博弈 主体 的 理性 和 学 习 能 力 有 差异 ,来自 同 一 个 博弈 的 不 同 博弈 主体 在 理性 方面 也 会 有 较 
大 差异 。 
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描述 的 稳定 均衡 一 一 演化 稳定 策略 ”, 恰 是 演化 博弈 分 析 中 最 核心 的 均衡 概念 。 

虽然 复制 者 动态 相当 重要 ,但 是 它 却 很 难 直 接 运用 到 社会 经 济 演化 中 。 在 社会 经 济 
演化 中 ,个 体 学 习 并 不 像 生 物 进 化 那样 毫 无 意识 和 缺乏 能 动 性 。 反 之 ,个 体 具 有 一 定 的 认 
知 能 力 ,能 够 有 意识 地 做 出 选择 。 个 体 的 策略 学 习 过 程 是 策略 演化 的 重要 动力 机 制 。 因 
此 ,许多 学 者 都 尝试 进一步 拓展 演化 动态 模型 ,将 个 体 学 习 过 程 引 入 演化 博弈 中 。 由 此 ， 
按照 个 体 意识 (或 者 理性 ) 的 强 弱 , 可 以 将 个 体 的 学 习 模 型 归纳 为 三 类 : 一 是 无 意识 的 学 
习 , 包 括 强 化 学 习 和 参数 化 的 自动 学 习 模 型 ; 二 是 模仿 学 习 ; 三 是 强 意 识 的 信念 学 习 , 包 
括 虚拟 行动 、 随 机 学 习 动 态 、 随 机 信念 学 习 、 贝 叶 斯 理性 学 习 和 经 历 加 权 吸 引 模 型 等 。 

本 节 将 介绍 两 种 具有 代表 性 的 演化 机 制 : 针对 理性 层次 较 高 .反应 速度 较 快 的 “最 优 
反应 动态 ”, 和 对 于 理性 层次 较 低 、 反 应 速度 较 慢 的 “复制 者 动态 2”。 


7.3.1 最 优 反应 动态 


最 优 反应 动态 是 进化 博弈 理论 中 典型 的 动态 机 制 之 一 ,该 机 制 适用 于 数量 少 且 具 有 
快速 学 习 能 力 的 有 限 理 性 参与 者 之 间 的 重复 博弈 和 策略 进化 。 在 此 机 制 下 ,参与 者 虽然 
缺乏 在 复杂 局 面 下 准确 判断 和 全 面 预 见 的 能 力 , 但 是 具有 较 快 的 学 习 能 力 。 在 一 次 博弈 
结束 之 后 ,参与 者 会 对 本 期 结果 进行 分 析 、 总 结 , 对 不 同 策略 的 结果 做 出 比较 正确 的 事后 
评估 并 相应 调整 策略 。 经 过 参与 者 多 次 的 策略 调整 ,最 终 由 “演化 稳定 策略 "给 出 博弈 的 
均衡 解 。 但 所 有 的 博弈 一 定 有 均衡 吗 ? 不 一 定 ! 在 这 种 分 析 框 架 下 ,博弈 分 析 的 目的 不 
在 于 给 出 参与 者 的 最 优 策略 选择 ,而 在 于 有 限 理性 参与 者 组 成 的 群体 成 员 的 策略 调整 过 
程 .趋势 和 稳定 性 。 

首先 用 一 个 简单 的 例子 来 解释 最 优 反应 动态 。 假 设 有 这 样 一 个 村 庄 : 6 家 有 限 理性 
的 村 民 围 成 一 圈 居 住 ,决定 是 否 互 助 。 他 们 满足 上 文中 对 参与 者 的 要 求 。 对 于 任意 一 家 
村 民 , 他 和 与 己 紧 邻 的 两 家 邻居 分 别 进行 图 7-6 所 示 的 博弈 。 


参与 者 2 
冷 对 (A) 互助 (B) 
> 


图 7-6 最 优 反应 动态 博弈 得 益 矩 阵 


如 图 7-6 所 示 , 该 博 计 有 两 个 纯 策 略 纳什 均衡 : 〈 冷 对 , 冷 对 ) 和 (互助 ,互助 )。 在 这 
两 个 纳什 均衡 中 ,( 互 助 ,互助 ) 明 显 帕 累 托 优 于 ( 冷 对 , 冷 对 )。 现 在 6 家 村 民 围 居 一 圈 , 如 
图 7-7 所 示 。 六 边 形 上 的 每 个 位 置 都 是 村 民 。 每 家 村 民 只 与 自己 的 左右 邻居 反复 博弈 。 
在 这 里 ,不 对 初次 博弈 进行 限定 ,假设 每 个 位 置 的 村 民 随 机 采取 策略 “ 冷 对 "或 “ 互 
助 ”。 因 此 会 出 现 64 种 情况 。 我 们 用 zxi() 表 示 在 1 阶段 第 i 家 村 民 左右 邻居 中 采取 冷 


@@ 该 机 制 是 根据 生物 进化 中 生物 性 状 和 行为 特征 动态 变化 的 过 程 设 计 的 。 生 物 进化 理论 具有 在 动态 调整 过 程 
中 恢复 或 者 达到 稳健 性 均衡 的 特点 ,对 分 析 有 限 理性 条 件 下 的 博弈 均衡 具有 十 分 重要 的 意义 。 
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对 (A) 策 略 的 数量 。 例 如 图 7-8 所 示 的 情况 下 ,zz1(D) 二 2,zx2 (1) 二 1,x3(1) 二 1,z74(1) 二 0， 
ZX5(t)=1,x6(t)=1。 


1 2 1A 2A 
人 e 
5 4 5B 4B 
图 7-7 6 家 村 民 的 位 置 图 7-8 博弈 者 选择 一 


综合 考虑 :阶段 zi(0) 的 情况 ,在 每 一 个 时 期 zi(4) 的 可 能 结果 有 三 种 : 0、1、2, 分 别 表 
示 两 边 没有 选择 A 的 村 民 、 两 边 有 1 位 选择 A 的 村 民 和 两 边 都 是 选择 A 的 村 民 。 如 果 


村 民 ; 选择 策略 A, 则 其 期 望 得 益 为 2 全 49[2 一 (DD]， 如 果 村 民 ;选择 策略 B, 他 


的 期 望 得 盖 为 92 一 9] 
根据 最 优 反应 动态 机 制 ,村 民 们 会 根据 对 手 的 情况 调整 自己 的 决策 。 如 果 自 己 试图 
追求 更 多 得 益 的 策略 没有 被 其 他 村 民 认同 ,那么 在 下 一 轮 决 策 时 ,该 决策 者 会 放弃 追求 更 


多 得 益 。 
如 果 32 中 十 49[2 一 (0D] ~ OO 二 6 一 aa 部 
时 期 采用 冷 对 (A) ,否则 采用 互助 (B)。 由 于 zi() 的 取 值 范围 是 被 限定 在 0、1、2 这 三 个 
整数 值 中 ,因此 ,在 1 时 期 村 民 i 的 两 家 邻居 之 中 只 要 有 一 人 以 上 采取 冷 对 策略 ,那么 他 
在 下 一 时 期 的 博弈 中 也 会 采用 冷 对 ; 只 有 两 家 邻居 都 没有 采用 冷 对 ,村 民 i 才 会 在 1 十 1 
时 期 采用 互助 。 
下 面 用 一 个 例子 来 说 明 最 优 反应 动态 的 演化 过 程 。 假 定 开始 的 时 候 有 相 邻 的 两 家 村 
民 1 号 和 2 号 选择 冷 对 策略 ,其 余 村 民 全 部 选择 互助 策略 ,那么 

1 号 周围 有 1 人 选择 冷 对 ,1 号 下 下 一 轮 中 依然 选择 冷 对 。 

2 号 周围 有 1 人 选择 冷 对 ,2 号 在 下 一 轮 中 依然 选择 冷 对 。 

3 号 周围 有 1 人 选择 冷 对 ,3 号 在 下 一 轮 中 选择 冷 对 。 

4 号 周围 全 部 选择 互助 ,4 号 在 下 一 轮 中 选择 互助 。 

5 号 周围 全 部 选择 互助 ,5 号 在 下 一 轮 中 选择 互助 。 

6 号 周围 有 1 人 选择 冷 对 ,6 号 在 下 一 轮 中 选择 冷 对 。 

于 是 一 轮 过 后 将 产生 图 7-9(b) 所 示 的 结果 。 以 此 类 推 可 以 产生 图 7-9(c) 所 示 的 结果 。 


(0 之 至 ,村 民 i 会 在 t 十 1 


1A 2A 1A 2A 1A 2A 
5B 4B 5B 4B 5A 4A 
(a) (b) (c) 


图 7-9 最 优 反应 动态 博弈 一 
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达到 图 7-9(c) 所 示 的 状态 后 ,所 有 村 民 都 没有 选择 策略 互助 的 动力 。 所 以 全 部 选择 
冷 对 策略 是 一 个 演化 稳定 策略 。 同 理 , 初 次 博弈 全 部 为 互助 策略 时 ,也 是 一 个 演化 稳定 
策略 。 

但 所 有 博弈 一 定 都 能 够 达到 演化 稳定 策略 吗 ? 如 图 7-10 所 示 , 如 果 初 次 博弈 只 有 1 
人 选择 冷 对 策略 。 随 着 演化 博弈 的 进行 ,六 家 村 民 将 不 断 在 图 7-10(c) 和 (d) 之 间 跳 转 , 这 
个 博弈 就 不 存在 演化 稳定 策略 。 


1A 2B IB 2A 
6B 3B DC 6A 3B 
5B 4B 5B 4B 
(a) (b) 
1B 2A 1A 2B 
6A 3B 《> 6B 3A 
5B 4A 5A 4B 
(d) (9) 


图 7-10 最 优 反应 动态 博弈 二 


WW 进 阶 阅读 : 电力 竞价 最 优 反应 动态 博弈 


目前 大 多 数 国家 和 地 区 使 用 的 电力 市 场 竞价 机 制 主要 有 两 种 : 一 种 是 统一 市 场 出 清 
价格 (MCP) 机 制 ; 另 一 种 是 按 报价 支付 (PAB) 机 制 。 在 此 我 们 主要 讨论 MCP 机 制 。 

MCP 机 制 是 指 各 个 发 电 商 向 交易 中 心 提交 报价 曲线 ,而 交易 中 心 对 所 有 发 电 商 都 按 
相同 的 价格 统一 出 清和 结算 的 方式 。 目 前 世界 上 绝 大 多 数 的 电力 市 场 都 采用 该 竞价 机 
制 。 在 MCP 竞价 机 制 下 ,市 场 中 所 有 申报 的 中 标 电 量 均 按照 市 场 中 最 后 中 标的 发 电 商 
所 报价 格 ( 市 场 出 清 价格 ) 来 结算 。 发 电 商 在 选择 竞价 策略 时 需要 考虑 所 有 的 发 电 成 本 和 
机 组 运行 约束 ,并 将 发 电 过 程 中 的 一 些 隐 含 成 本 体现 在 报价 中 。 

日 前 竞价 交易 以 机 组 为 单位 进行 ,对 发 电 商 报价 进行 网 损 修正 ,并 以 市 场 总 购 电 费用 
最 低 为 目标 进行 竞价 交易 。 所 有 未 安排 合同 交易 电量 的 竞价 机 组 均 可 以 参与 日 前 交易 。 
日 前 竞价 交易 对 次 日 的 剩余 未 平衡 电量 进行 竞争 ,合同 交易 电量 的 执行 方式 不 变 , 其 他 规 
定 不 变 。 日 前 交易 各 时 段 最 后 一 台中 标 机 组 在 中 标 出 力 的 报价 为 该 时 段 的 边际 价格 ,日 
前 交易 按 边 际 价格 结算 。 日 前 交易 按 日 组 织 , 每 日 交易 一 次 。 每 个 交易 日 为 一 个 日 历 日 ， 
从 次 日 0:00 至 次 日 24:00, 以 15 分 钟 为 一 个 时 段 。 日 前 交易 的 竞价 空间 是 次 日 各 个 时 
段 剩 余 的 负荷 空间 ,为 次 日 各 个 时 段 全 网 负荷 预测 值 减 去 非 竞价 机 组 的 合同 分 解 电量 、 竞 
价 机 组 已 分 解 的 合同 及 合同 交易 电量 。 每 个 工作 日 10:00 之 前 ,发 布 日 前 交易 市 场 信息 。 
市 场 主体 对 东北 电网 有 限 公 司 发 布 的 日 前 交易 市 场 信息 如 果 有 异议 ,应 在 当日 11:30 前 
向 东北 电网 有 限 公司 提出 。 
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交易 之 前 ,发 电 商 能 得 到 如 下 信息 : 上 一 轮 市 场 出 清 价格 及 自身 的 中 标 出 力 ; 本 轮 
预测 负荷 曲线 、 最 高 和 最 低 限 价 等。 发 电 商 以 机 组 为 单位 进行 竞价 ,每 个 交易 日 的 竞价 按 
不 同 交 易 时 段 申报 ; 竞价 包括 段 电价 和 相应 的 容量 ; 每 段 给 出 10 个 出 力 点 及 相应 电价 ; 
竞价 曲线 非 减 ,第 一 个 点 必须 是 机 组 所 能 达到 的 最 小 出 力 点 ; 对 于 每 个 交易 时 段 ,电力 交 
易 中 心 按 发 电 商 的 竞价 从 低 到 高 排序 , 逐 段 截取 各 发 电 商 申报 的 容量 ,直到 所 有 已 截取 的 
容量 之 和 满足 负荷 需求 时 ,此 时 的 价格 就 是 市 场 的 出 清 价格 ,市 场 采 用 此 价格 进行 结算 。 

现在 规定 ,发 电 商 的 成 本 函数 为 过 原点 的 二 次 函数 ,形式 如 下 : 

Ci(Pi) 一 aPi 十 OP? 
式 中 : Ci(CPi) 为 发 电厂 守 的 成 本 函数 ; Pi 为 发 电厂 的 出 力 或 发 电量 ; 4a,0 为 系数 。 

在 每 次 交易 开始 之 前 ,发 电 商 向 交易 中 心 提供 各 自 的 报价 曲线 Bi 一 Bi(Si,Pi), 其 中 
Si 为 该 发 电厂 的 报价 策略 向 量 , 即 报价 曲线 的 套数。 交易 中 心 收 到 各 个 发 电 商 的 报价 
后 , 按 低 报价 优先 交易 的 原则 组 织 交易 ,确定 各 竞价 电厂 的 中 标 电 量 。 最 后 一 个 中 标 电 厂 
中 标 段 的 报价 为 市 场 出 清 价格 。 根 据 以 上 给 出 的 市 场 条 件 ,可 以 得 到 竞价 发 电 商 的 得 益 
函数 mi; 


Ni BPi— Gi(Pi) (Bi 一 a)Pi op? 
假设 区 域 电力 市 场 中 每 个 发 电 商 只 有 两 种 策略 选择 : 高 价 策略 和 低 价 策略 。 设 在 1 
时 期 发 电 商 采取 高 价 策略 且 竞 价 成 功 的 概率 为 yi ,发 电 商 采取 低 价 策略 且 竞 价 成 功 的 概 
率 为 zi ,市 场 中 采取 高 价 策略 的 发 电 商 个 数 为 ,相应 的 采取 低 价 策略 的 发 电 商 的 个 数 
为 nn 一。 设 市 场 需求 量 为 Q, 当 区 域 电力 市 场 中 电力 供不应求 或 者 供求 平衡 时 , 即 
Paax<Q 时 ,发 电 商 在 竞价 中 采取 高 价 策略 是 一 定 可 以 成 功 的 , 即 % 一 1。 为 了 提高 利 
润 , 所 有 发 电 商 都 将 采取 高 报价 的 策略 。 
当 区 域 电力 市 场 中 电力 供过于求 时 ,所 有 发 电 商 都 采取 高 价 策略 必然 会 导致 一 部 分 
发 电 商 无 法 竞价 成 功 ,因此 必然 会 有 一 部 分 发 电 商 采取 低 价 策略 。 


< 时 ,发 电 商 采取 低 价 策略 是 一 定 可 以 竞价 成 功 


的 , 即 zt 二 1。 此 时 ,市 场 上 剩余 的 发 电容 量 Q 一 PL 留 给 了 采取 高 价 策略 的 发 电 商 ,故此 
让 =]1— "Pmax—Q) 


ZiP max 


当 0<PL<Q, 即 


当 Q<PL<Paw, 即 0<s<f 吕 一 Qn 时, 发电 商 采取 高 价 策略 一 定 会 失败, 即 y, 一 


0。 此 时 市 场 上 有 数量 为 PL 的 低 价 发 电量 去 竞争 市 场 上 总 的 竞价 电量 空间 Q, 故 此 时 
—_nQ 


nw) 
发 电 商 在 一 次 竞价 中 采取 高 价 策略 可 以 成 功 竞 得 的 发 电量 为 PiH 二 yiPimax ,采取 
低 价 策略 可 以 成 功 竞 得 的 发 电量 为 Pi 一 ZiPimax。 得 益 分 别 为 
niH = BiHPiH 一 Ci(Pia) = (Bi,H — a)yPismax — by?P?, max 
Ail = BiLPiL — Ci(PiL) = (Bi — a) yePimar — by?2PY ox 


maxo 
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当 发 电 商 采取 高 价 策略 的 得 益 大 于 采取 低 价 策略 的 得 益 时 ,在 下 一 期 所 有 发 电 商 都 
能 做 出 最 优 反 应 , 即 都 将 采取 高 价 策略 ; 反之 ,在 下 一 期 所 有 发 电 商 都 将 采取 低 价 策略 。 
当 二 者 相等 时 ,采取 高 价 策略 的 发 电 商 个 数 保持 不 变 。 

菜 地 区 有 6 个 有 限 理 性 的 发 电 商 ,他 们 具有 相同 的 成 本 函数 和 机 组 容量 。 发 电 商 降 
价 容量 段 为 [200,500], 发 电 成 本 函数 为 Ci(Pi) 二 93.21Pi 十 0. 18P?。 

表 7-2 所 示 为 发 电 商 的 报价 方案 。 


表 7-2 发 电 商 报价 方案 


高 价 方案 
容量 段 / 兆 瓦 200 ,300 300,400 400,500 
价格 /( 元 / 兆 瓦 时 ) 225 240 255 
低 价 方案 
容量 段 / 兆 瓦 200 ,300 300,400 400,500 
价格 /( 元 / 兆 瓦 时 ) 185 200 215 


根据 上 述 报价 方案 可 以 得 到 发 电 商 竞价 的 得 益 和 矩阵 ,如 图 7-11 所 示 。 
高 价 低 价 


高 价 | 73 395y 一 45 000y2, 73 395y,-45 000y? | 73 395y,-45 000w, 53 395y,-45 000w2 


低 价 | 53 395y,-45 000y2, 73 395y 一 45 000y? | 53 395y,-45 000y2, 53 395y,-45 000)7 


图 7-11 发 电 商 得 益 和 矩阵 


设 市 场 的 竞价 电量 空间 为 2100 兆 瓦 时 ,在 短 时 期 内 保持 不 变 ; 各 竞价 电厂 能 够 提供 
的 最 大 出 力 为 500 兆 瓦 时 , 则 所 有 发 电厂 参与 竞价 得 到 


i 仙 元 时 一 224 259z, 3 754 ， 若 0 过 过 Pumax — Q, 三 让 得 
《6 一 名) Prmax 
99%, 3955z? 一 145 
29 899z 十 2 145 2 8 395， 关 Q, 二 人 
Xr max 


711) 
求 得 交点 z1 二 2.054 3。 如 果 当 前 采取 高 价 的 企业 数量 大 于 2 个 , 则 下 一 期 所 有 企业 
采取 高 价 策略 ; 如 果 当 前 采取 高 价 的 企业 不 高 于 2 个 , 则 下 一 期 全 部 采取 低 价 。 


7.3.2 复制 者 动态 


1. 应 铝 博 弈 
现在 回 到 我 们 熟悉 的 应 铝 博 弈 模型 (图 7-12) 。 为 了 描述 方便 ,我 们 将 强硬 策略 表述 
为 鹰 策 略 ,妥协 策略 表述 为 铝 策 略 。 


演化 博弈 理论 研究 的 重点 是 群体 ,而 非 单个 动物 ,目的 是 描述 稳定 群体 所 采取 的 混合 


第 7 章 演化 博弈 273 


动物 2 
座 镶 
座 | -5.-5 | 30.0 
动物 1 | 00 | 
的 | 0,30 | 15.15 | 


图 7-12 座 铝 博弈 模型 


策略 。 为 了 达到 这 个 目的 ,首要 关注 的 是 策略 ,从 这 个 角度 出 发 ,动物 仅仅 是 研究 策略 的 
工具 。 使 用 策略 的 动物 可 以 随意 挑选 ,但 群体 采取 的 混合 策略 可 以 一 直 存 在 。 

我 们 用 来 描述 稳定 群体 结构 的 方法 是 以 自然 选择 理论 为 基础 的 : 获得 较 高 适应 值 的 
策略 可 以 繁殖 更 多 的 后 代 , 这 就 增加 了 后 代 群 体 采取 该 策略 的 概率 。 把 这 种 机 人 制 模型 化 ， 
我 们 就 需要 记录 采取 每 种 策略 可 以 得 到 的 适应 值 。 我 们 用 FCz,y) 表 示 ,与 一 只 被 赋予 y 
策略 的 动物 博弈 时 ,被 赋予 x 策略 的 动物 得 到 的 适应 值 。 


< 全 tt 六 通 庙 应 函数 Fer. 


此 处 的 工 、y 不 同 于 前 文中 的 p、g, 前 文中 采取 的 是 混合 策略 ,每 个 个 体 采取 腐 策略 的 
概率 为 p,q, 即 他 还 有 1 一 pp 或 1 一 g 的 概率 采取 鲍 策 略 。 而 此 处 的 工 和 yy 只 是 广 策 略 或 
饮 策 略 中 的 一 种 ,因为 每 一 个 个 体 只 能 采取 其 中 的 一 种 策略 。 正 如 我 们 在 讨论 天 气 的 时 
候 , 我 们 可 以 说 明天 下 雨 的 概率 为 40% ,而 不 能 说 昨天 下 十 的 概率 为 40%。 因 为 明天 没 
有 到 来 其 结果 未 知 ,可 以 说 下 雨 的 可 能 性 有 四 成 。 但 昨天 已 经 发 生 , 只 存在 下 雨 或 者 没 下 
雨 这 两 种 可 能 性 中 的 一 种 。 


对 于 那些 采取 应 策略 的 动物 , 当 与 采取 相同 策略 的 另 一 个 参与 者 争斗 时 ,每 个 参与 者 
获得 一 5 的 适应 值 ; 当 与 采取 铅 策 略 的 参与 者 争斗 时 ,获得 30 的 适应 值 。 所 以 在 这 个 群 
体 中 ,采取 应 策略 的 动物 可 以 得 到 的 期 望 平均 适应 值 取 决 于 这 个 群体 的 混合 策略 。ps 表 
示 在 上 代 中 被 赋予 鹰 策 略 的 个 体 在 群体 中 的 概率 ,采取 应 策略 的 个 体 得 到 的 平均 适应 值 
就 表示 为 

万 ( 座 ) = 一 5 X pi 十 30 X (1 一 pi) (7-12) 
(应 ) 表 示 采 取 座 策略 的 个 体 在 1 代 的 适应 值 的 平均 值 , 它 等 于 它 和 采取 应 策略 的 个 体 
争斗 所 获得 的 适应 值 一 5, 以 及 与 采取 铀 策略 的 个 体 获 得 的 适应 值 30 的 加 权 平均 数 , 这 个 
权重 是 应 策略 与 名 策略 分 别 在 群体 中 的 比例 。 

同 理 , 在 上 代 中 采取 铀 策略 得 到 的 适应 值 表示 为 

fi( 钨 ) = 二 0Xpi+15X (1 一 pi) (7-13) 

复制 者 动态 解释 了 当 采 取 某 策略 获得 的 适应 值 大 于 群体 平均 值 时 ,使 用 该 策略 的 后 
代 比 例 就 会 增长 ,反之 则 减少 。 在 应 铝 博弈 理论 中 ,在 后 代 : 中 群体 平均 适应 值 表示 为 

f= pi X fi( 座 ) 十 (1 一 p) Xf.( 鲍 ) 

在 鹰 鸽 博弈 中 复制 者 动态 方程 可 以 表示 为 

Pi 二 pixX i) 
fi 
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或 等 价 表示 为 
Pil 一 Pt _ 族 ( 认 ) 一 ff 
pr fi 

这 个 方程 式 说 明了 t 十 1 代 中 “ 座 策 略 占 比 的 变化 百分比 ”与 “采取 鹰 策略 的 适应 值 的 变化 
百分比 ?成 正比 。 当 上 代 中 采取 应 策略 的 适应 值 高 于 群体 的 适应 值 时 ,采取 应 策略 的 比例 
增加 ; 反之 采取 应 策略 的 比例 减 小 。 同 时 , 增 减 的 幅度 与 适应 值 变 化 的 幅度 成 正比 。 

那么 ,在 什么 情况 下 采取 应 策略 的 比例 将 保持 不 变 ? 当 采 取 应 策略 的 适应 值 等 于 采 
取 铝 策略 的 适应 值 时 ,群体 中 采取 应 策略 的 比例 和 采取 铀 策略 的 比例 将 不 变 , 即 

5X 姑 十 30X(1 一 太 ) 和 0X 太 十 15X(1L 一 加 ) 

求解 可 得 pi 二 0.75, 即 当 群 体 中 采取 座 策 略 的 概率 为 75% 时 ,群体 达到 演化 稳定 策略 。 
WW 进 阶 阅读 : 复制 者 动态 的 一 般 解 

座 饮 博弈 以 及 复制 者 动态 的 全 部 讨论 是 基于 图 7-12 所 示 的 得 益 天 阵 ,那么 其 中 的 数 
值 从 何 而 来 ? 下 面 我 们 将 讨论 磨 铭 博弈 以 及 复制 者 动态 的 一 般 解 。 

设 资源 为 V, 采 取 订 策略 的 个 体 受 伤 的 损失 为 一 CC(V<C) , 订 铭 博弈 的 得 益 和 矩阵 可 以 
用 图 7-13 表示 。 


图 7-13 鹰 铭 博 弈 的 得 益 和 矩阵 
当 灯 取 订 策略 的 个 体 与 采取 乌 策 略 的 个 体 争 斗 时 ,双方 都 可 能 获得 资源 ,也 都 可 能 受 
伤 , 在 双方 胜率 均 在 50%6 的 条 件 下 , 庆 策 略 的 适应 值 是 5。 当 采 取 计 策略 的 个 体 与 采 


取 鸟 策略 的 个 体 博 弈 时 ,采取 鲍 策 略 的 个 体 主动 退出 争斗 ,采取 座 策 略 的 个 体 获得 全 部 资 
源 ,其 适应 值 为 V。 当 采取 馈 策 略 的 个 体 与 采取 馈 策 略 的 个 体 争斗 时 ,双方 都 不 会 受伤 ， 
直到 其 中 一 方 退 出 争斗 ,在 双方 胜率 均 在 50% 的 条 件 下 ,采取 多 策略 的 适应 值 是 。 

此 时 , 式 (7-12) 和 式 (7-13) 将 变 为 以 下 形式 : 


Exp FHVX OQ—p) (7-14) 


1( 座 ) 
V 
fi( 久 ) 二 0Xpr+X (1 一 pr) (7-15) 
当 [1( 座 ) 二 f ,时 ,采取 座 策 略 的 比例 增加 , 即 


YExptVX Gp > px 
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[Exarvxa-p Hp x[ xpt¥y x 0—p] 


可 以 得 到 : p< 

当 /.( 腐 ) 二 /时 , 同 理 可 得 : 入 > 龙 。 
当 /.( 腐 ) 二 时, 同 理 可 得 : 户 一 七 。 

由 以 上 推导 可 得 ; 当 采 取 座 策略 适应 值 大 于 群体 的 平均 适应 值 时 ,采取 鹰 策略 的 比 
例 小 于 交 , 此 时 腐 策略 的 比例 增加 。 当 采取 腐 策略 适应 值 小 于 群体 的 平均 适应 值 时 ,采取 
廊 策 略 的 比例 大 于 ,此 时 雇 策 略 的 比例 减 小 。 当 采取 记 策 略 适应 值 等 于 群体 的 平均 适 
应 值 时 ,采取 麻 策 略 的 比例 等 于 上 ,此 时 座 策 略 的 比例 不 变 , 达 到 演化 稳定 策略 。 这 种 赵 
势 可 以 用 图 7-14 所 示 的 动态 演化 图 表示 。 


图 7-14 鹰 铭 博弈 理论 中 的 复制 者 动态 


2. 猎 鹿 博弈 

许多 动物 通过 彼此 之 间 的 合作 达到 共同 目的 。 狮 子 (通常 是 叭 性 ) 群 体 逐 猎 时 比 单个 
行动 更 有 效 , 土 狼 在 追逐 更 大 的 猎物 时 也 会 选择 围 狂 。 上 述 eg 
情景 可 以 模拟 为 猫 鹿 博弈 ,如 图 7-15 所 示 。 猎 鹿 博 弈 在 第 2 猎 座 猫 锡 
章 的 静态 博弈 中 也 出 现 过 ,但 在 本 章 将 会 赋予 新 的 话题 。 ，。 独 咎 [44 13 

假设 在 代 中 ,群体 比例 为 x: 的 成 员 采 取 合作 的 策略 。 那 全 党 ! | 


么 每 个 成 员 采 取 合作 策略 ( 猫 鹿 ) 得 到 的 平均 适应 值 为 
ss X4+ (1l—s)X1=1+3s 
而 如 果 单 兵 作战 ( 猫 兔 ), 则 得 到 平均 适应 值 为 
stX3++(1—s)X3=3 

借助 复制 者 动态 , 当 且 仅 当 采取 合作 策略 得 到 的 适应 值 大 于 群体 的 平均 适应 值 时 , 采 
取 合作 策略 的 成 员 的 比例 才 会 增加 。 因 为 只 有 两 种 策略 ,这 就 是 说 ,采取 合作 策略 得 到 的 
适应 值 大 于 采取 单 兵 作战 策略 得 到 的 适应 值 , 即 

i 


因此 当 Y > 二 时 ,下 一 代 采 取 合 作 策略 的 成 员 的 比例 才 会 增加 。 反之 , 当 3 二 1 二 3s， 


图 7-15 ” 猫 鹿 博弈 


即 一 了 时 ,下 一 代 采 取 合 作 策略 的 成 员 的 比例 将 会 减少 。 
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如 果 一 开始 就 有 忆 的 成 员 采 取 合作 的 策略 ,有 二 的 成 员 采 取 单 兵 作战 的 策略 ,在 这 样 


的 群体 中 ,采取 合作 与 采取 单 兵 作 战 策 略 得 到 的 适应 值 都 为 3。 既 然 所 有 的 策略 得 到 的 
适应 值 都 一 样 ,复制 者 动态 就 使 群体 处 于 稳定 状态 。 


这 个 动态 过 程 如 图 7-16 所 示 : 当 一 了 时 ,采取 合作 策略 的 成 员 减 少 ; 当时 ， 
采取 合作 策略 的 成 员 增 加 。 
F 


0 


wlb 一 - 


图 7-16 猫 鹿 博弈 中 的 复制 者 动态 


现在 我 们 对 鹰 铭 博 弈 和 猎 鹿 博弈 进行 对 比分 析 。 这 两 种 博弈 都 存在 一 个 固定 的 点 ， 
在 座 饮 博弈 中 ,这 个 固定 的 点 即 采 取 座 策略 的 概率 是 0.75; 在 猎 鹿 博弈 中 ,这 个 固定 的 点 
即 群体 中 采取 合作 策略 的 比例 是 2/3。 这 个 固定 的 点 是 静止 点 ,静止 点 就 是 使 得 复制 者 
动态 不 受 干扰 的 群体 混合 策略 。 一 旦 群体 处 于 静止 点 ,复制 者 动态 就 使 群体 一 直 处 于 这 
个 状态 ,一 代 又 一 代 。 

在 鹰 铝 博 弈 和 猎 鹿 博弈 中 ,静止 点 不 仅 一 个 。 在 鹰 铝 博 弈 中 ,群体 中 采取 鹰 策略 的 比 
例 为 0 和 采取 应 策略 的 比例 为 100%% 也 是 静止 点 ,因为 在 这 两 个 点 上 没有 应 策略 或 铝 策 
略 的 基因 ,所 以 无 法 遗传 。 在 猎 庵 博弈 中 ,初始 选择 合作 的 比例 为 0 或 初始 选择 合作 比例 
为 100% 也 是 静止 点 。 


但 这 些 静 止 点 并 不 完全 相同 。 在 猎 鹿 博弈 中 ,如 果 初始 合作 的 参与 者 的 比例 为 子 , 那 


么 群体 是 稳定 的 ,但 只 要 出 现 一 点 儿 偏 差 , 群 体 的 稳定 就 会 失衡 。 而 在 座 名 博弈 中 , 当 采 
取 应 策略 的 比例 为 0.75 时 ,即使 有 些许 偏离 也 会 快速 回 到 这 个 稳定 的 点 。 

我 们 称 座 鸟 博 穿 中 的 0. 75 是 演化 稳定 策略 。 不 论 群 体 结构 最 初 的 组 成 比例 是 多 少 ， 
群体 中 采取 应 策略 的 成 员 比 例 最 终 都 将 演化 为 0.75。 在 鹰 铝 博 弈 中 只 有 一 个 演化 稳定 
策略 , 即 采取 应 策略 的 比例 为 0.75。 只 要 采取 应 策略 的 比例 的 初始 值 不 是 0 或 1 ,最 终 都 
会 演化 为 0.75。 但 是 猎 鹿 博弈 中 有 两 个 演化 稳定 策略 ,分 别 是 全 合作 与 全 不 合作 。 如 果 


初始 选择 合作 的 比例 小 于 亏 , 则 会 演化 为 全 体 不 合作 。 如 果 初始 合作 比例 大 于 六 ,将 会 演 
化 为 全 体 合 作 。 定 义 0 和 1 是 两 个 吸引 子 。 我 们 把 初始 合作 比例 小 于 二 称 为 吸引 子 0 的 


吸引 域 , 初 始 合作 大 于 孔 称 为 吸引 子 100% 的 吸引 域 。 


@ 静止 点 也 称 为 驻 点 或 平衡 点 ,可 利用 系统 动力 学 或 微分 知识 求解 。 同 时 ,在 考查 系统 的 演化 时 需 注意 导数 或 
差分 的 符号 , 它 决 定 着 策略 的 演化 方向 。 相 关 动 力学 知识 可 参考 钟 永光 的 (系统 动力 学 )。 
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( 科 他 儿 访 , 前 止 点 (平衡 点 ) 和 吸引 于 (演化 均 街 
为 了 更 好 地 理解 静止 点 和 吸引 子 的 稳定 性 ,请 参照 图 7-17 所 示 。 


高 度 


1 
1 
1 
1 
| 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
区 


如 


位 置 
图 7-17 静止 点 和 吸引 子 的 稳定 性 


我 们 可 以 形象 地 将 图 7-17 比 作 山峰 和 山谷 ,如 工 是 山峰 ,v、z 是 山谷 。 如 果 一 个 小 
球 位 于 以 点 ,显然 它 不 可 能 保持 稳定 ,一 定 会 滚 到 vv 点 (不 考虑 滑 到 山谷 之 后 继续 摆动 的 
情况 )。 同 理 , 如 果 这 个 小 球 在 y 点 , 则 它 会 滚 到 < 上 点。 如 果 小 球 恰好 位 于 点 .Xx 点 或 之 
点 , 它 将 不 会 滚动 。 这 三 个 点 的 区 别 在 于 : 在 v 点 (或 z 点 ) 时 ,如 果 给 小 球 一 个 轻微 的 扰 
动 ,小 球 还 会 回 到 v 点 (或 点 ); 但 如 果 小 球 在 工 点 ,只 要 给 一 个 轻微 的 扰动 , 它 就 会 滚 
动 到 Uv 点 或 < 点 。 

因此 ,图 7-17 中 点 .Xx 点 和 xz 点 都 是 静止 点 ,但 Uv 点 和 z 点 是 吸引 子 , 工 点 不 是 吸引 
子 。 吸 引子 相当 于 演化 博弈 中 的 演化 均衡 概念 。 

3. 闻 红 灯 问 题 * 

“中 国 式 过 马路 0” 曾 一 度 在 网 络 上 被 炒 得 沸沸扬扬 。 事 实 上 ,行人 间 红 灯 已 经 成 为 
道路 安全 的 重大 隐患 。 行 人 的 违章 行为 不 仅 会 扰乱 道路 交通 秩序 ,更 有 其 者 会 为 此 付出 
鲜血 乃至 生命 的 代价 。 据 公安 部 统计 数字 显示 ,2012 年 1 一 10 月 ,全 国 因 违反 道路 标志 
标 线 营 事 导 致 人 员 伤 亡 的 道路 交通 事故 87 852 起 ,造成 26 154 人 死亡 ,其 中 因 行 人 违规 
导致 的 掌 事 造成 262 人 死亡 。 

在 交叉 口 过 街 的 行人 会 形成 一 个 临时 的 群体 ,群体 中 的 个 人 行为 会 受到 群体 或 他 人 
的 影响 。 当 行人 横 穿 道路 交叉 口 时 ,看 到 别人 不 走 人 行 横道 或 者 在 红 灯 信 号 时 横 穿 马路 ， 
也 会 受 其 影响 采取 同样 的 行动 ; 相反 ,如 果 现 场 行 人 都 能 遵守 交通 规则 , 受 大 家 的 感染 ， 
个 别人 也 会 克制 自己 ,遵守 交通 规则 。 

对 行人 来 讲 , 无 论 追 随 他 人 阅 红 灯 , 还 是 受 人 影响 守 规 则 ,都 是 一 种 从 众 心理 ,这 是 一 
种 普遍 的 心理 现象 。 有 研究 人 员 通 过 对 行人 违法 过 街 的 原因 进行 问卷 调查 ,发 现 六 成 的 
被 调查 者 回答 的 原因 为 “从 众 心理 ”和 “看 到 道路 两 边 没 有 机 动车 通行 ”", 在 进一步 被 问 到 


@ 指 凑 够 一 报 人 就 可 以 走 了 .和 红绿灯 无 关 的 行为 模式 。 
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“假如 您 看 到 有 许多 人 间 红 灯 您 也 随 他 们 一 起 过 马路 的 理由 ”时 ,58.7% 的 受 访 者 认为 是 
受 他 人 影响 , 即 从 众 心 理 在 作 崇 。 此 外 有 研究 表明 ,不 同类 型 的 人 ,从 众 行为 的 程度 也 不 
一 样 。 一 般 来 说 ,女性 从 众多 于 男性 ; 性 格 内 向 、 容 易 自 卑 的 人 多 于 外 向 、 自 信 的 人 ; 文 
化 程度 低 的 人 多 于 文化 程度 高 的 人 ; 等 等 。 

闻 红 灯 问 题 中 需要 讨论 的 关系 不 仅 在 于 行人 与 交警 之 间 的 博弈 关系 ,行人 与 行人 之 
间 的 行为 互动 同样 值得 重视 。 行 人 与 交警 之 间 的 关系 多 表现 为 个 体 与 个 体 通过 不 同 决策 
的 直接 影响 来 反映 ,而 行人 间 红 灯 从 众 现 象 中 ,行人 与 行人 之 间 本 身 直接 的 影响 不 显著 ， 
更 多 的 是 无 数 个 体 决策 对 局 之 中 群体 行为 的 逐步 演变 。 这 时 群体 是 有 限 理 性 的 ,其 决策 
的 转换 也 是 渐变 、 慢 速 的 ,因此 应 当 采 用 博弈 论 当中 的 演化 模型 来 对 其 进行 分 析 。 

前 面 已 指出 大 多 数 行人 闻 红 灯 受 从 众 心理 驱使 ,因此 我 们 重点 考察 在 从 众 心理 驱使 
下 ,个 人 决策 的 演化 过 程 。 

我 们 首先 从 某 一 时 刻 的 静态 博弈 开始 说 明 行人 行人 2 
闻 红 灯 概 率 ( 可 视 为 人 群 中 间 红 灯 人 数 的 比例 ) 的 动 
态 演 化 过 程 。 图 7-18 是 关于 行人 是 否 闻 红 灯 的 一 
个 静态 博弈 。 在 这 个 博弈 中 ,两 参与 者 都 有 "“ 冯 红 灯 
(R)” 和 “等 待 (W)” 两 种 可 选 策略 。 

(1) 当 两 参与 者 都 选择 闻 红 灯 时 ,符合 从 众 心 
理 , 将 二 者 得 益 设 为 1。 

(2) 当 有 一 方 选择 闻 红 灯 另 一 方 选择 等 待 时 ,各 参与 者 承受 了 对 方 的 选择 所 带 来 的 
行为 引导 与 失范 压力 9。 因 此 ,等 的 人 和 间 的 人 同样 忍受 着 失范 的 负 向 刺激 。 对 间 红 灯 
的 行人 而 言 , 其 获得 了 时 间 优 势 , 但 是 需要 承担 相应 的 安全 风险 ; 而 等 红 灯 的 行人 虽然 具 
有 道德 优势 ,但 也 须 忍 受 时 间 的 流逝 。 综 合 考虑 ,等 红 灯 的 效用 与 闻 红 灯 的 效用 可 视 为 等 
同 。 这 里 为 了 方便 计算 ,我 们 将 一 闻 一 等 时 各 自得 益 均 设 为 1/2。 

(3) 当 两 参与 者 都 选择 等 待 时 , 既 遵 守 了 交通 规则 又 符合 了 从 众 心理 ,将 二 者 得 益 均 
设 为 3/2。 

为 了 研究 博弈 中 两 种 类 型 的 行人 在 整个 群体 中 所 占 比例 的 演化 , 现 假设 整个 群体 中 
闻 红 灯 类 型 的 比例 为 pz 。 显 然 , 等 待 类 型 的 行人 比例 为 1 一 p2。 

不 难 计算 出 R 型 和 W 型 两 种 类 型 参与 者 各 自 的 期 望 得 益 UR 和 Uw 为 


Ur 一 户 十 二 一) 


行人 1 


图 7-18 行人 与 行人 之 间 的 博弈 矩阵 


Uw = pe + 一 pe) 


因此 群体 成 员 的 平均 得 益 为 
U= p22UR + (1— pe)Uw 


@ 演化 博弈 模型 所 反映 的 实际 上 是 无 数 多 个 个 体 的 反复 决策 。 考 虑 到 从 众 心理 本 身 使 得 行人 的 判断 源 于 对 他 
人 的 随从 ,此 时 “从 众 "作为 一 种 范式 和 “遵守 "这 种 范式 并 无 本 质 性 差异 。 此 时 ,失范 不 再 单 指 “ 间 红 灯 ",… 拒 绝 从 众 ” 
也 是 一 种 失范 。 
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妈 十 pall pz) + 字 (1 pz)? 


考虑 到 每 个 行人 都 是 有 学 习 能 力 的 理性 个 体 , 这 意味 着 两 种 类 型 行人 的 比例 pz 和 
(1 一 p2) 不 是 固定 不 变 的 ,而 是 随时 间 变 化 的 ,可 以 写成 时 间 的 函数 pz2(1) 和 1 一 p2(1), 为 
简单 起 见 可 仍 写 成 pz 和 1 一 p2。 

以 及 型 行人 的 比例 为 例 , 其 动态 变化 速度 不 仅 与 效用 的 变化 方向 和 大 小 有 关 , 也 与 
当前 R 型 行人 比例 有 关 , 可 以 用 下 列 动态 微分 方程 表示 : 


dp DD = p[30 2 (1 p2)?| 


dt 
通过 等 式 变换 易 知 , 新 增 间 红 灯 的 行人 比例 2 x 二 上 主要 受 间 红灯区 益 大 小 UR 一 吕 


a 


的 影响 。 当 9 全 一 0 时 ,行人 间 红 灯 和 等 待 的 比例 保持 不 变 。 当 SP:>>0 时 表示 行人 由 等 


待 转 为 闻 红 灯 的 比例 增 大 ; 反之 减 小 。 因 此 我 们 更 加 关注 9 经 的 变化 方向 。 


邻 SE 一 0, 即 动态 微分 分 方程 等 于 0, 可 解 得 静止 点 pz 二 0,2/3,1。 在 区 间 (0,2/3) 上 ， 


Me <0; 在 区 间 (2/3,1) 上 ， 人 其 速度 变化 图 (相位 图 ) 如 图 7-19 所 示 。 
民 一 一 一 h — 一 一 六 
0 芭 1 
2 


图 7-19 行人 的 动态 演化 
图 7-19 说 明 , 静 止 点 0 和 1 是 稳定 平衡 点 ,而 ps 一 也 是 不 稳定 平生 点。 由 于 请 缆 估 


阵 中 的 数字 是 根据 观察 所 给 定 的 ,因此 硅 只 是 一 个 特定 的 数值 ,不 一 定 符合 实际 。 但 是 本 


文 的 一 个 重要 结论 是 不 稳定 静止 点 的 存在 性 , 即 确实 存在 这 样 一 个 临界 点 p* , 当 间 红 灯 
比例 处 在 p* 的 不 同 侧 时 ,系统 将 向 不 同 的 方向 演化 。 当 整体 中 间 红 灯 人 群 比例 小 于 力 * 
时 ,部 分 行人 间 红 灯 所 导致 的 负 向 刺激 将 会 战胜 闻 红 灯 所 带 来 的 便利 ,此 时 这 些 行人 常常 
会 倾向 于 约束 自己 ,遵守 交通 规则 , 即 部 分 R 型 人 群 会 转变 为 W 型 人 群 ; 反之 , 当 闽 红 灯 
人 和 群 的 比例 大 于 p* 时 ,行人 浆 红 灯 所 带 来 的 便利 战胜 了 负 疫 感 。 在 这 种 情况 下 ,行人 会 
选择 从 众 心理 而 闯红灯 , 即 部 分 W 型 人 群 会 转变 为 及 型 人 群 。 

事实 上 ,整体 人 和 群 是 由 表现 为 不 同 闻 红 灯 可 能 性 的 个 体 所 组 成 的 。 有 些 人 的 闻 红 灯 
概率 非常 高 ,有 些 人 的 闻 红 灯 概 率 非常 低 。 有 研究 表明 (参见 潘 汉中 等 ,2012), 在 闻 红 灯 
人 群 中 有 三 个 群体 : 第 一 种 为 风险 追寻 者 ,他 们 往往 在 红 灯 面 前 3 秒 之 内 就 决定 闻 红 灯 ; 
第 二 种 为 忍耐 力 极 高 的 群体 ,不 论 红 灯 有 多 长 ,他 们 都 会 自觉 遵守 ,直到 信号 灯 转 绿 ; 第 
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三 种 为 通常 群体 ,他 们 的 忍耐 值 分 布 不 均 , 但 是 极限 值 是 50 秒 , 超 过 50 秒 就 不 愿意 再 等 
候 下 去 。 因 此 p* 是 一 个 临界 点 ,在 一 定时 点 上 间 红 灯 概 率 表 现 为 p* 的 人 是 摇摆 的 , 既 
可 能 更 加 坚定 地 闻 红 灯 , 也 可 能 更 倾向 于 等 待 。 宽 松 一 点 儿 讲 ,p* 左右 的 人 群 最 易 受 影 
响 而 改变 自身 类 型 ,我 们 称 之 为 “摇摆 人 群 ”。 摇 摆 人 和 群 是 闻 红 灯 行 人 群体 中 的 主体 部 分 ， 
同时 该 群体 对 于 社会 预期 得 益 的 变化 较为 敏感 ,其 行为 决策 最 容易 受到 环境 影响 而 发 生 
转变 。 通 过 调整 摇摆 人 群 的 行为 方式 ,能 够 在 很 大 程度 上 缩小 闻 红 灯 群 体 的 规模 ,这 也 是 
我 们 在 管理 中 应 着 重 关注 的 人 群 。 


7.3.3 非 对 称 复制 者 动态 


复制 者 动态 实际 上 旨 在 描述 某 一 特定 策略 在 一 个 种 群 中 被 采用 的 频数 或 频 度 的 动态 
微分 方程 。 根 据 演 化 的 原理 ,一 种 策略 的 适应 度 或 支付 比 种 群 的 平均 适应 度 高 ,这 种 策略 
就 会 在 种 群 中 发 展 ， 即 适 者 生存 体现 在 这 种 策略 的 增长 率 汪 大 于 0, 可 以 用 以 下 微分 
方程 给 出 : 


1 dz 
Xk dt 


式 中 : zx 为 一 个 种 群 中 采用 策略 & 的 比例 ; u(k,s) 为 采用 策略 时 的 适应 度 ; u(s,s) 为 
平均 适应 度 ;为 不 同 的 策略 。 
现在 假设 有 这 样 一 种 博弈 ,博弈 双方 的 得 益 如 图 7-20 所 示 。 双 方 各 有 两 种 策略 一 一 


= [ul(kss) 一 as] 


合作 和 竞争 。 如 果 双 方 均 采取 竞争 策略 , 则 均 会 获得 二 痉 者 2 
正常 得 益 5,5。 如 果 双 方 均 采取 合作 策略 , 则 博弈 者 作者 条 
1 和 博弈 者 2 分 别 会 获得 额外 得 益 5,3, 此 时 两 者 的 i 


得 益 分 别 为 10 和 8。 如 果 博 弈 者 1 采取 竞争 策略 ， 博弈 者 | [5 
但 博弈 者 2 采取 合作 策略 , 则 博弈 者 2 将 会 损失 1 点 全 
得 益 , 此 时 的 得 益 分 别 为 5 和 4。 如 果 博 弈 者 1 采取 图 7-20 非 对 称 博 蛮 矩阵 
合作 策略 ,但 博弈 者 2 采取 竞争 策略 , 则 博弈 者 1 会 
损失 2 点 得 益 , 此 时 的 得 益 分 别 为 3 和 5。 

现在 假设 博弈 者 1 采取 合作 策略 的 概率 为 x, 则 采取 竞争 策略 的 概率 为 1 一 z。 博 弈 
者 2 采取 合作 的 概率 为 y, 采 取 竞 争 策 略 的 概率 为 1 一 y>。 则 博弈 者 1 采取 合作 策略 的 平 
均 得 益 为 


u( 合 作 ,s) = yX10 二 (1 一 y)X3 
博弈 者 1 采取 竞争 策略 的 平均 得 益 为 
u( 竞 争 ,s) = yX5 二 (1 一 y) X5 
博弈 者 1 的 平均 得 益 为 
auw(s 5) = xzX[yX10+(1—y)X3j]+(—z)x[yX5+(1—y)x5] 
所 以 博弈 者 1 的 重复 动态 得 益 方程 为 


同 理 可 得 博弈 者 2 的 重复 动态 得 益 方程 为 


对 于 该 方程 ,可 以 通过 雅克 比 和 矩阵 来 求 得 其 均衡 点 。 
对 于 复制 者 动态 ,其 雅克 比 和 矩阵 如 下 : 


aFl 
三 9 并 
| 器 
9 并 
首先 找到 其 静止 点 。 
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dz1 

Fi= A [xu( 舍 作 ,s) 一 u(s,s)] 

= 7x(l— 7x)(7y—2) 

~ dz2 

下 2 yh =r= 1 
aFl 
ay | 人 一 ) 
a9Fz 4y(1 一 y) (Car 11— 2 
ay 
令 重 复 动态 方程 等 于 零 , 即 Fi 二 0,F2 二 0 时 ,该 点 为 稳定 点 。 


1 2 


据 此 ,静止 点 共有 5 个 (1,0),01,D,(0,0),(0,D, (地 :地 )。 


对 于 离散 系统 , 当 且 仅 当 det(J) 二 0,\tr(JD) 一 0 时 ,静止 点 为 演化 稳定 的 ,所 对 应 策略 


为 ESS。 
1。 对 于 (1,0) 点 
多 
雅克 比 矩阵 为 。 。) ,其 行列 式 为 6, 迹 为 5。 不 符合 要 求 。 
2。 对 于 (0,1) 点 
雅克 比 算 阵 为 (。 1 ) ,其 行列 式 为 5, 迹 为 6。 不 符合 要 求 。 
3. 对 于 (0,0) 点 
= 
雅克 比 算 阵 为 ( 。。“ ) ,其 行列 式 为 2, 迹 为 一 8。 符合 要 求 。 


4. 对 于 (1,1) 点 


雅克 比 算 阵 为 { 。 “。) ,其 行列 式 为 15, 迹 为 一 8。 符 合 要 求 。 


5. 对 于 点 ( 填 , 子 ) 
0 Pin 
雅克 比 矩 阵 为 | 
四 
为 0。 不 符合 要 求 。 


所 以 该 演化 博弈 的 演化 稳定 点 为 (0,0) 和 (1,1)。 GA 


该 演化 博弈 的 相 图 如 图 7-21 所 示 , 其 中 箭头 表示 演 0 1 
化 方向 。 图 7-21 非 对 称 演化 博弈 相 图 


一 
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7.4 利他 行为 的 演化 


并 引 语 故事 : 利他 之 心 成 就 了 第 二 家 世界 500 强 企业 KDDI 


日 本 的 电信 市 场 自 明治 维新 以 来 一 直 由 日 本 电信 电话 公司 (NTT) 一 家 独占 ,通信 费 
用 贵 得 离谱 。1984 年 ,日 本 政府 决定 打破 垄断 ,对 通信 事业 实施 民营 化 。 但 日 本 的 大 企 
业 害 怕 与 实力 强大 的 NTT 对抗, 都 按兵不动 。 

当时 著名 企业 家 ,京瓷 创始 人 稻 盛 和 夫 认 为 : 从 世界 范围 来 看 ,日 本 的 长 途 话费 因为 
垄断 贵 得 出 奇 , 降 低 长 途 话费 ,为 民众 做 贡献 , 正 符合 自己 的 事业 目的 。 经 过 整整 半年 的 
反复 思索 , 稻 盛 和 夫 终 于 认定 自己 “动机 纯 ,私心 无 "”。 于 是 不 再 犹 孙 ,设立 “第 二 电 电 ”, 积 
极 参 与 通信 行业 的 竞争 。 

京瓷 董事 会 开会 时 ,董事 们 异口同声 反对 : 京瓷 公司 现在 发 展 很 好 ,何必 要 到 一 个 陌 
生 的 领域 去 冒 这 么 大 的 风险 呢 ? 弄 不 好 ,新 事业 不 成 功 ,还 要 伤 老 企 业 的 元 气 。 

稻 盛 和 夫 认 为 京瓷 积累 了 1 500 亿 日 元 的 自由 资金 , 拿 出 1 000 个 亿 , 即 使 失败 ,也 不 
会 动摇 根本 。 并 且 参 考 美国 的 情况 ,只 要 竞争 ,通信 成 本 有 很 大 的 压缩 空间 ,这 中 间 就 有 
巨大 的 商业 机 会 ,做 得 好 , 既 能 大 幅 降 低 民 众 的 通信 费用 ,自身 也 能 获 利 ,而 且 在 良性 竞争 
的 条 件 下 ,可 以 推动 整个 通信 事业 的 健康 发 展 。 最 后 , 稻 盛 和 夫 力 排 众 议 ,使 董事 会 通过 
了 参与 通信 事业 的 决议 。 

京瓷 参与 竞争 的 决定 公布 后 不 久 , 又 有 两 家 公司 也 宣布 参与 竞争 。 

从 第 二 电 电 开 创 时 起 , 稻 盛 和 夫 就 反复 对 员工 强调 :“ 我 们 必须 努力 ,努力 降低 民众 
的 长 途 电 话 话费 。”* 人 生 只 有 一 次 ,我 们 一 定 要 让 自己 宝贵 的 人 生变 得 更 有 意义 。”“ 现 在 
的 机 会 百年 难 遇 ,我 们 诚 仙 地 感谢 上 苍 , 我 们 要 抓 住 这 天 赐 的 良机 。” 为 了 这 项 事业 的 成 
功 , 即 使 贡献 自己 的 生命 ,我 也 在 所 不 惜 。” 

第 二 电 电 的 全 体 员 工 都 从 为 民众 谍 利 的 纯粹 动机 出 发 ,从 内 心 深 处 强烈 地 渴望 成 功 ， 
全 身心 地 投入 工作 。 开 张 一 年 后 ,条 件 最 差 的 “第 二 电 电 ”取得 了 最 优秀 的 业绩 ,电话 线路 
合同 数 为 三 家 新 公司 之 首 。 当 初 的 “第 二 电 电 ”, 后 来 发 展 为 仅 次 于 NTT 的 日 本 第 二 大 
通信 企业 KDDI。 

从 上 面 的 例子 可 以 看 出 , 稻 盛 和 夫 决 定 涉足 通信 行业 主要 有 以 下 原因 : @ 日 本 政府 
希望 打破 NTT 的 垄断 ,支持 民间 资本 进入 通信 行业 。 回 当时 京瓷 集团 有 1 500 亿 日 元 的 
闲置 资本 , 拿 出 其 中 1 000 亿 日 元 投入 一 个 政府 支持 的 垄断 性 行业 并 非 不 可 行 。 图 最 重 
要 的 一 点 是 稻 盛 和 夫 没 有 私心 ,愿意 为 了 降低 日 本 的 通信 费用 做 出 贡献 。 

利他 之 心 是 稻 盛 和 夫 经 营 哲 学 的 基础 ,为 了 员工 、 客 户 及 社会 的 福 社 ,他 可 以 舍弃 自 
己 及 自己 企业 的 利益 。 按 理 说 ,这 应 该 会 影响 到 企业 的 发 展 。 然 而 有 目 共 睹 的 是 ,在 过 去 
50 年 中 , 稻 感 和夫 亲手 培植 了 京瓷 和 KDDI 两 家 世界 500 强 企 业 , 而 且 历 经 经 济 危 机 ,这 
两 家 公司 从 未 出 现 过 亏损 年 份 。 

所 以 , 自 利 与 利他 不 是 一 个 零 和 博弈 游戏 。 稻 盛 和 夫 通 过 利他 放大 了 自 利 。 
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迪克 西 特 和 奈 尔 伯 夫 在 《妙趣 横生 博弈 论 ) 一 书 中 指出 ,在 商界 、 政 界 , 参 与 者 的 动机 
是 自私 和 利他 、 关 注 正义 或 公平 .短期 考虑 和 长 期 考虑 等 的 复杂 混合 体 。 在 大 量 的 分 配 博 
弈 ?中 ,提议 金额 的 中 位 数 分 布 在 总 金额 的 40 外 一 50% ; 在 很 多 的 实验 中 ,五 五 分 的 分 割 
比例 是 唯一 最 常见 的 提议 。 提 议 者 给 回应 者 相当 大 份额 的 原因 ,一 是 多 种 动机 ,提议 者 除 
了 自私 动机 之 外 ,还 有 利他 性 、 对 公平 的 关注 等 其 他 动机 ; 二 是 策略 需要 ,分 配 份额 较 低 
时 可 能 会 被 拒绝 。 实 验 表明 ,其 中 的 主要 因素 是 利他 动机 和 公平 动机 。 

因此 ,在 进行 博弈 分 析 时 ,应 当 考 虑 参与 者 对 公平 、 利 他 的 关注 。 在 博弈 论 的 前 沿 研 
究 中 , 正 逐 渐 将 平等 ,利他 主义 及 类 似 的 动机 纳入 参与 者 的 目标 。 

为 什么 参与 者 这 么 关注 利他 、 公 平 呢 ? 首先 ,在 演化 心理 学 中 可 以 找到 一 个 比较 合理 
的 解释 一 一 那些 向 其 成 员 灌 输 公 平 主义 和 利他 主义 准则 的 集团 , 比 只 强调 自私 的 个 人 组 
成 的 集团 更 少 发 生 内 部 冲突 ,而 且 在 与 其 他 集团 竞争 时 更 有 效率 。 其 次 ,也 存在 生物 学 方 
面 的 证 据 。 在 一 次 实验 中 ,拒绝 不 公平 提议 的 人 的 学 丸 激素 比 那 些 接受 不 公平 提议 的 人 
高 50%。 

达尔 文 进化 论 确立 以 后 ,人 们 特别 关注 生物 进化 中 的 生存 竞争 和 适 者 生存 。 但 是 , 生 
物力 至 社会 集团 .民族 和 国家 之 间 即 使 在 利益 部 分 冲突 的 情况 下 也 存在 利他 现象 。 

有 许多 实验 生物 学 家 对 生命 有 机 体 的 回报 行为 进行 了 实验 室 和 野外 观察 。 此 后 , 关 
于 互惠 理论 的 研究 工作 大 量 涌现 ,成 果 和 迭出 ,对 诸多 领域 产生 了 深刻 的 影响 。 这 些 成 果 在 
很 大 程度 上 得 益 于 博弈 论 工具 ,尤其 是 囚徒 困 境 分 析 方法 。 

从 博弈 论 来 看 ,利益 部 分 冲突 的 两 个 个 体 之 间 的 博弈 是 非 零 和 博弈 ,博弈 者 之 间 采 取 
的 行动 有 合作 和 背叛 两 种 。 互 惠 理 论 的 基本 思想 是 ,利益 部 分 冲突 的 个 体 之 所 以 采取 合 
作 行为 ,是 因为 他 可 能 在 今后 与 受 惠 者 相遇 时 得 到 回报 。 互惠 利他 行为 的 必要 条 件 有 以 
下 4 个 : 

(1) 该 行为 必须 减少 施 惠 者 与 某 个 自私 的 抉择 有 关 的 相关 度 。 

(2) 受 惠 者 的 适合 度 相对 于 非 受 惠 者 必须 得 到 提高 。 

(3) 该 行为 的 完成 必须 不 依赖 于 某 个 直接 利益 的 个 体 。 

(4) 条 件 (1)、(2) 和 (3) 必 须 适 用 于 参与 互惠 帮助 的 两 个 个 体 。 

这 里 ,条 件 (1) 和 (2) 是 使 该 行为 互惠 的 条 件 , 条 件 (3) 把 互惠 利他 主义 与 互助 主义 区 
别 开 来 ,条 件 (4) 使 利他 主义 互惠 。 这 4 点 分 开 是 必要 条 件 , 合 起 来 是 充分 条 件 。 互 惠 利 
他 主义 要 能 够 进化 ,还 必须 满足 另外 两 个 条 件 : 

(5) 必须 存在 察觉 "骗子 ”的 机 制 。 

(6) 必须 存在 大 量 不 确定 的 获得 帮助 的 机 会 。 

条 件 (5) 保 证 利他 主义 者 有 惩罚 不 合作 者 的 办 法 ,条 件 (6) 保 证 博弈 的 局 数 不 定 。 互 
惠 理论 把 有 机 体 采取 一 个 步骤 (合作 或 背叛 ) 得 到 的 结果 称 为 适应 值 。 

自己 背叛 而 对 方 合作 叫 作 背叛 的 诱惑 ,其 适应 值 用 工 表示 。 

双方 都 合作 叫 作 对 合作 的 奖励 ,其 适应 值 用 R 表示 。 


@ 即 最 后 通 朵 博弈 : 见 3. 5.2 节 。 
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双方 都 背叛 叫 作 对 背叛 的 惩罚 ,其 适应 值 用 己 表 示 。 

自己 合作 而 对 方 背叛 叫 作 对 傻瓜 的 欺骗 ,其 适应 值 用 S 表示 。 

当 对 手 合作 自己 背叛 时 结果 最 好 ,对 手背 叛 自 己 合作 时 结果 最 差 ,双方 合作 比 双方 背 
叛 结 果 要 好 ,适应 值 的 大 小 顺序 是 T>R 之 P>S, 这 称 为 指令 条 件 。 如 果 合 作 的 奖励 (R) 


高 于 背叛 的 诱惑 (T) 与 俊 瓜 的 欺骗 (S) 的 平均 , 即 R> 3 , 称 为 反 剥 削 条 件 。 


鉴于 指令 和 反 和 剥削 这 两 个 条 件 刻画 了 关于 囚徒 困境 的 假说 ,所 以 人 们 把 它们 定义 的 
互惠 利他 主义 称 为 标准 囚徒 困境 模型 。 这 里 , 反 剥 前 条 件 是 为 了 保证 困境 的 存在 ,因为 对 
合作 的 奖励 比 对 背叛 的 诱惑 和 对 傻瓜 的 欺骗 的 平均 效果 好 。 但 是 在 演化 的 过 程 中 ,如 果 


R 二 ,那么 困境 仍然 存在 。R< 二 意味 着 博弈 双方 轮流 获得 (诱惑 ) 和 S( 炊 骗 ) 


回报 的 效果 不 会 比 轮流 获得 尺 ( 奖 励 ) 的 效果 差 , 这 是 一 个 允许 博弈 者 交替 剥 前 和 滞后 合 
作 的 条 件 。 
T+S 


根据 上 述 表述 可 以 形成 以 下 5 种 情况 : DT>R>P>S 且 R>> 一 一; @T>R>P>> 


S 上 且 R< 巧 3 @T>P>R>S 且 P> 瑟 3, QT>P>R>S 且 P< 蕊 3 


i@TSPS> 


S>R 且 P53。 其 中 第 一 种 情况 是 标准 办 徒 困境 ,第 二 种 情况 是 修正 办 徒 困境 , 剩 下 
三 种 情况 被 称 为 "厨师 囚徒 困境 "。 

上 述 模型 对 一 些 生物 界 的 观察 结果 ,如 鲈鱼 的 性 角色 变换 , 狂 神 狐 狐 交配 中 的 雄性 个 
体 联盟 ,时 蝙蝠 的 血液 反哺 等 均 做 出 了 很 好 的 解释 。 

以 上 条 件 给 出 了 互惠 利他 主义 及 其 进化 的 可 能 性 。 但 是 ,现实 世界 中 的 情况 是 复杂 
的 。 这 些 条 件 并 不 意味 着 利他 者 总 是 采取 合作 行为 。 因 为 采取 这 种 行为 的 一 方 , 面 对 的 
如 果 总 是 采取 背 上 叛 行为 的 一 方 ,利益 将 会 严重 受 损 , 直 至 被 淘汰 出 局 。 所 以 ,利他 主义 者 
也 可 以 在 必要 时 采取 背叛 行为 。 

博弈 论 中 把 支配 博 讲 者 采取 合作 和 青 叛 行为 的 规则 称 为 策略 。 策 略 有 许多 种 ,以 上 
讲 的 任何 时 候 都 合作 和 任何 时 候 都 青 叛 分 别称 为 全 合作 策略 和 全 背叛 策略 。 还 有 一 种 交 
蔡 策 略 ,随机 地 选择 合作 或 背叛 ,采取 合作 和 青 叛 的 机 会 各 占 一 半 的 次 数 。 全 报复 策略 决 
不 首先 背叛 ,但 是 只 要 对 方 有 一 次 背叛 ,就 从 此 一 直 背叛 下 去 。 一 报 还 一 报 策略 是 第 一 步 
采取 合作 行为 ,然后 采取 对 方 上 一 步 采取 的 做 法 , 即 如 果 对 方 青 叛 就 选择 背叛 ,如 果 对 方 
合作 就 选择 合作 ,但 是 在 第 一 步 尚 不 明确 对 方 的 做 法 时 则 采取 合作 行为 。 两 报 还 一 报 策 
咯 是 第 一 步 合 作 ,如 果 对 方 连续 两 步 背叛 他 就 背叛 一 次 ,在 其 他 情况 下 都 采取 合作 。 以 上 
都 是 一 些 现实 生活 中 常见 的 策略 。 

阿 克 谢 罗 德 把 策略 的 进化 分 为 三 个 阶段 ,每 一 个 阶段 都 对 应 于 一 个 性 质 完全 不 同 的 
问题 ,从 而 把 利他 之 谜 放 到 进化 链条 中 并 更 加 精细 化 。 这 些 阶 段 和 问题 分 别 如 下 。 

01) 起 始 阶段 。 一 个 利他 的 策略 如 何 能 够 在 一 个 不 合作 占 优势 的 环境 中 取得 立足 之 
地 ? 这 个 问题 称 为 策略 的 初始 成 活性 问题 。 
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(2) 中 间 阶 段 。 什 么 类 型 的 策略 可 以 在 一 个 由 采用 其 他 多 种 复杂 策略 构成 的 多 样 化 
环境 中 繁荣 起 来 ? 这 个 问题 称 为 策略 的 强健 性 问题 。 

(3) 最 后 阶段 。 在 什么 条 件 下 ,这 样 的 策略 一 旦 完全 建立 就 能 抵抗 变异 策略 的 侵犯 ? 
这 个 问题 称 为 策略 的 稳定 性 问题 。 

可 以 这 样 理解 : 假设 一 个 群体 中 的 成 员 除 了 个 别 变异 个 体 之 外 都 采用 某 一 特定 策 
略 ,而 变异 个 体 采用 的 男 外 的 不 同 策略 就 是 变异 策略 。 如 果 变 异 个 体 所 得 得 益 高 于 群体 
成 员 的 平均 值 , 则 称 变异 策略 能 侵犯 这 个 群体 采用 的 策略 ; 反之 ,如 果 一 个 策略 不 能 被 其 
他 策略 侵犯 , 则 称 这 个 策略 是 集体 稳定 的 。 

假设 一 个 群体 的 成 员 采 用 了 若干 种 策略 ,如 果 其 中 一 种 策略 的 适应 值 大 于 其 他 策略 
的 适应 值 , 则 称 这 种 策略 是 进化 稳定 的 。 假 设 一 个 群体 开始 都 采用 全 背叛 策略 ,而 且 这 个 
策略 是 进化 稳定 的 ,那么 有 两 个 机 制 可 以 使 基于 合作 的 策略 成 活 。 

第 一 个 机 制 是 亲缘 关系 。 当 这 个 群体 中 的 一 员 因为 亲缘 关系 而 对 某 一 个 近亲 成 员 采 
取 利 他 行为 时 ,合作 就 会 出 现 。 这 样 , 合 作 就 会 逐步 使 有 近亲 关系 的 一 个 小 群体 受益 。 当 
远亲 成 员 对 利他 行为 不 回报 时 便 会 得 到 背叛 的 反应 。 这 样 ,合作 就 会 逐步 扩散 到 无 亲缘 
关系 的 群体 之 中 去 。 当 两 个 个 体 再 次 相遇 的 机 会 足够 大 时 ,基于 回报 的 合作 就 会 繁荣 并 
且 稳 定 下 来 。 

第 二 个 机 制 是 采用 基于 合作 的 策略 的 小 群体 成 员 之 间 的 相互 作用 。 只 要 这 个 小 群体 
的 成 员 相互 作用 的 比例 和 它们 相遇 的 机 会 足够 多 ,这 种 策略 就 会 成 活 并 且 稳 定 。 

合作 可 以 在 一 个 无 条 件 背叛 的 世界 里 产生 ,以 相互 回报 作为 宗旨 的 小 群体 之 间 , 一 旦 
有 交往 的 可 能 ,合作 便 会 出 现 。 这 样 ,基于 回报 的 策略 能 够 在 许多 不 同类 型 的 策略 组 成 的 
环境 里 成 长 起 来 ,并 且 能 够 抵抗 其 他 不 太 合作 的 策略 的 侵犯 。 

要 理解 这 些 命题 ,有 两 个 重要 的 概念 : 一 是 不 同步 又 博弈 的 得 益 ; 二 是 策略 相遇 时 
的 得 益 。 前 者 意 即 ,博弈 者 之 间 的 合作 基于 他 们 有 可 能 再 次 相遇 。 不 过 ,一 般 认为 未 来 所 
得 的 得 益 会 随 着 时 间 的 推移 而 减少 ,所 以 现在 比 未 来 更 为 重要 。 现 在 的 博弈 是 现实 ,再 次 
相遇 只 是 可 能 ,因此 演化 博弈 可 能 会 终结 于 对 手 的 职业 改变 .居住 地 迁移 .死亡 或 者 破 
产 等 。 


分 思考 与 练习 


请 从 利他 的 演化 的 角度 分 析 车 站 、 机 场 等 地 的 商品 店 质 次 价 高 ,以 及 离 家 较 近 的 便利 
店 经 济 实惠 这 一 现象 。 


本 章 小 结 与 习题 
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尽管 完全 利己 的 “经 济 人 ”假设 广 为 接 受 ,但 是 人 们 仍然 能 观察 到 大 量 事实 偏离 这 种 
假设 下 的 “ 非 合作 均衡 ”。 进 一 步 , 一 个 良好 的 机 制 能 够 引导 更 多 的 合作 行为 出 现 。 那 么 ， 
这 种 合作 机 制 是 如 何 协 调 成 员 的 行为 动机 的 ? 何 时 竞争 动机 占据 主导 地 位 ? 何 时 合作 占 
据 主 导 地 位 ? 如 果 你 身 处 其 中 ,又 该 如 何 行动 ? 本 章 将 以 “竞争 与 合作 ”为 主题 ,通过 五 个 
章节 逐步 深入 来 介绍 竞争 与 合作 的 共存 现象 和 参与 者 之 间 的 相互 作用 机 理 。 通 过 本 章 的 
阅读 与 学 习 , 相 信 你 可 以 找到 上 述 问题 的 答案 。 


在 生活 中 ,我 们 不 乏 看 到 企业 之 间 时 而 竞争 ,时 而 合作 的 现象 。 曾 经 在 一 年 (52 周 ) 
的 时 间 里 ,可 口 可 乐 和 百事 可 乐 分 别 在 美国 市 场 上 发 放 了 26 周折 扣 券 ,其 间 竟 没有 出 现 
同时 发 放 的 现象 。 这 样 的 小 概率 事件 之 所 以 发 生 ,一 定 是 可 口 可 乐 和 百事 可 乐 两 家 公司 
背后 达成 了 协议 。 麦 当 劳 和 肯德基 两 大 快餐 品牌 在 中 国 市 场 上 的 竞争 非常 激烈 。 但 是 在 
折扣 券 问 题 上 ,麦当劳 于 2010 年 2 月 开 诚 布 公 地 表示 ,用餐 时 可 以 使 用 肯德基 的 优惠 券 。 
那么 ,究竟 是 什么 原因 促使 激烈 竞争 的 企业 转向 合作 或 达成 默契 ? 


8.1 协调 以 避免 竞争 


“我 们 的 晚餐 并 不 是 来 自 属 夫 、 啤 酒 酿造 者 或 点 心 师傅 的 善心 ,而 是 源 于 他 们 对 自身 
利益 的 考虑 …… 每 个 人 只 关心 他 自己 的 安全 、 他 自己 的 得 益 。 他 由 一 只 看 不 见 的 手 引 导 
着 ,去 提升 他 原本 没有 想 过 的 另 一 目标 。 他 通过 追求 自己 的 利益 ,结果 也 提升 了 社会 的 利 
益 , 比 他 一 心 要 提升 社会 利益 还 要 有 效 。” 

1776 年 ,亚当 。 斯 密 在 (国富 论 ) 中 写 下 了 这 段 话 。 在 漫长 的 古典 市 场 经 济 阶段 中 ， 
资本 主义 国家 一 直 信 奉 亚 当 ， 斯 密 等 的 经 济 思想 ,实行 “自由 放任 ”的 经 济 政策 ,用 价值 规 
律 来 自发 地 调节 市 场 经 济 的 运转 。 

但 是 ,市 场 经 济 的 主体 是 分 散 独立 的 商品 生产 者 和 经 营 者 ,是 趋 利 避 害 的 “经 济 人 ”。 
他 们 为 了 自身 的 经 济 利 益 而 不 顾 社 会 整体 利益 ,只 做 对 自己 有 利 的 事情 ,并 且 对 整个 社会 
的 商品 供求 情况 缺乏 全 面 了 解 。 若 政府 不 从 宏观 上 加 以 引导 和 限制 ,在 某 些 情况 下 将 会 
导致 社会 发 展 的 失衡 。1929 一 1933 年 的 资本 主义 世界 经 济 危机 给 社会 带 来 空前 的 灾难 ， 
使 人 们 深刻 认识 到 自由 放任 的 市 场 经 济 理论 存在 的 次 端 。 由 此 ,各 国政 府 开 始 普 遍 关 注 
宏观 调控 与 市 场 经 济 的 联系 ,进行 国家 干预 ,采取 了 不 同 的 反 危 机 措施 。1936 年 ,凯恩斯 
《就 业 、 利 息 和 货币 通论 ) 的 发 表 , 标 志 着 宏观 经 济 学 的 产生 。 逐 步 完 善 的 “凯恩斯 主义 ”成 
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为 第 一 次 世界 大 战 后 西方 资本 主义 国家 制定 经 济 政策 .厉行 国家 干预 的 理论 基础 ,促进 了 
第 一 次 世界 大 战 后 资本 主义 经 济 的 大 发 展 。 

宏观 经 济 学 的 建立 说 明 , 理 性 的 “经 济 人 "在 市 场 博弈 中 并 非 总 能 得 到 好 结果 。 在 某 
些 情 况 下 ,政府 的 干预 和 协调 是 不 可 或 缺 的 。 推 而 广 之 ,对 诸如 ”囚徒 困 境 ? 和 ”* 公 地 悲剧 ” 
等 博弈 问题 ,采用 非 合作 博弈 分 析 方法 得 到 的 结果 令 人 不 甘 , 那 么 是 否 存在 协调 的 方法 或 
途径 ,使 所 有 参与 者 都 得 到 更 为 满意 的 结果 ? 答案 是 肯定 的 ! 本 节 将 先 通 过 案例 阐释 协 
调 的 可 能 性 和 必要 性 ,接着 用 协调 成 功 的 案例 来 证 明 : 通过 协调 而 非 直接 竞争 可 以 得 到 
一 个 使 所 有 参与 者 都 更 为 满意 的 结果 。 


过 下 案例 8-1: 谁 能 成 为 股东 


顶尖 律师 事务 所 通常 会 从 内 部 资历 较 深 的 专业 人 士 当 中 选择 合伙 人 ,使 之 成 为 新 的 
股东 。 参 与 竞争 的 落选 者 则 必须 离开 ,他 们 的 出 路 通常 是 低 一 档次 的 律 所 。 员 斯 廷 一 凯 
斯 律师 事务 所 对 合伙 人 的 选择 标准 非常 挑 别 , 以 至 于 多 年 来 选 不 出 一 个 新 股东 。 律 所 里 
资历 较 深 的 专业 人 士 对 职位 停滞 不 前 的 状况 非常 不 满 , 股 东 们 则 是 推出 了 一 个 看 上 去 非 
常 民主 的 新 体系 来 回应 。 

以 下 就 是 既得 利益 者 一 一 股东 们 的 新 体系 : 到 了 一 年 一 度 决 定 股东 人 选 之 时 ,10 名 
资历 较 深 的 专业 人 士 的 能 力 会 被 评分 , 按 水 平 由 低 到 高 评 出 1 一 10 分 。 这 些 竞争 者 会 被 
私下 告知 自己 的 得 分 ,并 公开 投票 决定 成 为 股东 的 必需 得 分 (换个 角度 ,可 以 称 为 最 低 标 
准 , 即 要 想 成 为 股东 需 满足 的 最 低 分 数 )。 

首先 ,他 们 将 必需 得 分 定 为 1 分 。 接 着 ,其 中 一 个 得 分 较 高 的 同事 建议 将 必需 得 分 定 
为 2 分 。 他 的 理由 是 ,这 样 可 以 提高 整个 股东 团体 的 平均 素质 。 这 一 建议 得 到 9 票 鞠 成 。 
唯一 的 反对 票 来 自 能 力 最 差 的 同事 ,而 这 个 人 就 失去 了 成 为 股东 的 资格 。 

接 下 来 ,有 人 提议 将 标准 从 2 分 提高 到 3 分 。 这 时 还 有 8 人 得 分 高 于 3 分 ,他 们 一 致 
赞成 这 一 改善 整个 股东 团体 的 提议 。 只 得 2 分 者 反对 ,因为 这 一 提议 使 他 失去 了 成 为 股 
东 的 资格 。 但 是 得 分 最 低 的 同事 对 提高 标准 的 提议 也 投了 赞成 票 。 无 论 这 一 提议 能 不 能 
通过 ,他 都 不 能 成 为 股东 。 不 过 ,若是 这 一 提议 通过 ,他 就 能 和 得 分 为 2 的 同事 一 起 成 为 
落选 者 。 结 果 , 其 他 律师 事务 所 虽然 知道 他 落选 的 结果 , 却 无 法 知道 他 的 评分 。 他 们 只 会 
猜测 他 可 能 得 了 ] 分 或 2 分 ,而 这 一 不 确定 性 显然 对 他 本 人 有 利 。 于 是 ,提高 得 分 标准 的 
提议 以 9 票 鞠 成 1 票 反对 获得 通过 。 

以 后 每 通过 一 个 新 的 得 分 标准 ,都 有 人 建议 提高 1 分 。 所 有 得 分 超过 这 一 建议 标准 
的 人 都 会 投票 支持 ,希望 提高 整个 股东 团体 的 素质 (而 又 不 必 牺 牲 自 己 的 利益 ) ,而 所 有 得 
分 低 于 这 一 建议 标准 的 人 也 愿意 投 资 成 票 .希望 自己 的 落选 原因 变 得 更 加 扑朔迷离 。 每 
一 回合 都 只 有 一 人 反对 ,就 是 那个 刚好 处 于 现 有 得 分 标准 \ 一 旦 建议 通过 就 没有 机 会 入 选 
股东 的 同事 。 但 他 的 反对 以 1 : 9 的 悬殊 比分 败 下 阵 来 。 

如 此 下 去 ,直到 得 分 标准 一 路 上 涨 为 满分 10 分 。 最 后 ,有 人 建议 将 必需 得 分 提高 为 
11 分 ,结果 仍然 是 9 票 赞成 .1 票 反对 通过 。 这 一 系列 的 投票 使 每 一 个 人 最 后 都 回 到 起 点 
人 位置。 显然, 这 个 结果 上 比 大 家 都 得 到 提升 的 结果 更 粮 糕 。 不 过 , 它 却 是 来 自 集体 的 意愿 。 
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换言之 ,这 一 系列 投票 的 每 一 次 决议 都 是 以 9 票 鞠 成 .1 票 反 对 的 大 比 数 通 过 。 


假如 行动 是 一 步 步 推进 的 .那么 . 随 着 行动 的 逐步 推进 ,每 一 步 都 有 可 能 在 绝 大 多 数 
决策 者 眼 里 显得 很 有 吸引 力 。 但 最 后 结果 却 使 每 一 个 人 落得 还 不 如 原来 的 下 场 。 理 由 在 
于 ,投票 忽略 了 偏好 的 强度 。 在 上 述 例子 里 ,每 一 轮 投票 中 所 有 赞成 者 只 获得 些许 好 处 ， 
而 唯一 的 反对 者 却 失 去 了 很 多 。 在 10 次 投票 过 程 中 ,每 一 个 参与 竞争 的 同事 都 取得 了 9 
次 微小 的 胜利 , 却 在 一 次 重大 失败 中 赔 上 了 这 些 胜 利 带 来 的 好 处 。 

如 此 看 来 ,一 系列 的 小 步行 动 起 初 可 能 显得 很 诱 人 ,但 只 要 出 现 一 个 不 利 的 转折 ,就 
可 能 抵消 整个 过 程 的 得 益 。 单 单 某 一 个 人 认识 到 这 个 问题 并 不 意味 着 就 能 阻止 这 个 过 
程 。 这 个 团体 作为 一 个 整体 ,必须 以 一 种 协调 的 方式 “向 前 展望 、 倒 后 推理 ”, 并 确立 规则 。 
只 有 大 家 都 同意 将 改革 视 为 一 个 统一 方案 ,而 不 是 一 系列 的 小 步行 动 ,才能 避免 走 上 一 条 
表面 有 利 可 图 、 实 则 一 无 所 有 的 道路 。 


2 扩展 阅读 


历史 上 ,美国 国会 曾 在 投票 决定 是 否 为 自己 加 薪 50% 的 时 候 唱 遇 失 败 。 最 初 ,加 薪 
得 到 了 参 众 两 院 的 广泛 支持 。 但 是 当 公众 听 说 他 们 的 打算 后 ,就 向 代表 自己 的 国会 议员 
发 出 了 强烈 抗议 。 结 果 ,国会 的 每 一 位 议员 私 底下 都 有 了 反对 加 薪 的 想法 ,因为 他 们 认为 
即使 自己 投 反对 票 , 加 薪 提 案 也 能 获得 通过 。 这 样 婚 能 为 自己 加 薪 , 又 获得 了 民意 支持 。 
不 幸 的 是 ,国会 有 太 多 议员 选择 这 么 做 ,于 是 突然 之 间 这 个 提案 能 不 能 获得 通过 变 得 扑 逆 
迷离 。 议 员 们 投票 反对 的 理由 反而 显得 越 来 越 充分 : 假如 加 薪 提 案 未 获 通 过 ,那么 自己 
可 能 被 记录 在 案 , 被 斥责 投票 鞠 成 加 薪 , 这 不 但 不 能 使 自己 加 薪 , 更 有 可 能 使 自己 付出 政 
治 代价 。 起 初 可 能 只 有 几 个 人 出 于 私心 希望 改善 自己 在 选民 心目 中 的 地 位 ,但 每 一 次 偏 
差 都 在 增强 随 大 流 的 趋势 ,结果 这 个 提案 最 终 没 有 获得 通过 。 


世上 下 案例 8-2: 政治 家 的 较量 


在 两 党 竞选 中 ,两 个 政党 要 确定 自己 究竟 处 于 “自由 一 保守 ”意识 形态 划分 表 中 的 哪 
一 个 位 置 , 以 获得 选民 支持 。 首 先 由 在 野党 提出 自己 的 立场 ,然后 执政 党 进行 回应 。 

假定 选民 平均 分 布 在 整个 划分 表 的 各 个 区 间 。 为 使 问题 具体 化 ,我 们 把 各 个 政治 立 
场 定 为 从 0 到 100。0 代表 极 左派 ,而 100 代表 极 右派 。 假 如 在 野党 选择 48, 中 间 偏 左 ， 
执政 党 就 会 在 这 一 点 到 中 点 之 间 做 出 选择 ,比如 49。 于 是 喜欢 48 及 48 以 下 的 选民 就 会 
投 在 野党 的 票 ,而 占据 人 口 51% 的 其 他 人 就 会 投 执 政党 的 票 。 结 果 执 政党 取胜 。 

假如 在 野党 选择 高 于 50 的 立场 ,那么 执政 党 就 会 在 这 一 点 和 50 之 间 站 稳 脚 跟 。 这 
么 做 同样 可 以 为 执政 党 赢得 超过 50% 的 选票 。 

基于 “向 前 展望 倒 后 推理 ”的 原则 ,在 野党 可 以 分 析出 自己 的 最 佳 立场 在 中 点 。 在 这 
个 位 置 ,鼓动 向 右 和 鼓动 向 左 的 人 在 数目 上 势均力敌 。 而 执政 党 的 最 佳 策略 就 是 模仿 在 
野党 。 两 党 选择 的 立场 完全 一 致 ,于 是 ,它们 将 在 只 有 议题 关系 大 局 的 情况 下 各 得 一 半 选 
票 。 这 个 过 程 中 的 失败 者 是 选民 ,他 们 得 到 的 只 是 两 党 互相 附和 的 回声 , 却 没 能 做 出 政治 
抉择 。 
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在 实践 中 ,两 党 不 可 能 选择 完全 一 致 的 立场 ,但 大 家 都 在 想方设法 靠近 中 点 。 这 一 现 
象 最 早 是 由 哥伦比亚 大 学 经 济 学 家 哈 罗 德 。 堆 特 林 在 1929 年 发 现 的 。 他 指出 经 济 和 社 
会 事务 存在 相似 的 案例 :“ 我 们 的 城市 大 得 毫 无 经 济 效益 ,其 中 的 商业 区 也 太 集 中 , 革 果 
酒 也 是 一 个 味道 .” 

假如 出 现 三 个 政党 ,还 会 不 会 存在 这 种 过 分 的 相似 性 ? 假定 它们 轮流 选择 和 修改 自 
己 的 立场 ,也 没有 意识 形态 的 包 被 约束 它们 。 原 来 处 于 中 点 外 侧 的 政党 会 向 它 的 邻居 靠 
拢 ,企图 争夺 后 者 的 部 分 支持 。 这 种 做 法 会 使 位 于 中 点 的 政党 受到 很 大 压力 ,以 至 于 轮 到 
它 选择 自己 的 立场 的 时 候 , 它 会 跳 到 外 侧 去 ,确立 一 个 全 新 的 立场 ,赢得 更 广泛 的 选民 。 
这 个 过 程 将 会 继续 下 去 ,完全 没有 均衡 可 言 。( 当 然 ,在 实践 中 ,政党 肩负 相当 大 的 意识 形 
态 包 窟 ,选民 也 对 政党 怀 有 相当 大 的 忠诚 ,不 会 出 现 此 类 和 急剧 的 转变 。) 

但 在 其 他 场合 ,立场 并 非 一 成 不 变 。 考 察 一 段 马 路 上 正在 等 出 租车 的 人 们 ,分 布 在 闹 
市 区 和 住宅 区 之 间 。 一 般 而 言 ,最 靠近 住宅 区 的 人 最 先 打 到 开 往 闹市 区 方向 的 出 租车 ,最 
靠近 闹市 区 的 人 则 最 先 打 到 开 往 住宅 区 方向 的 出 租车 ,而 站 在 两 区 之 间 的 人 则 少 了 很 多 
机 会 。 假 如 站 在 两 区 之 间 的 人 不 想 长 久 等 车 ,他 就 会 逆 着 目标 地 向 前 移动 ,以 便 增 加 打车 
机 会 。 同 时 ,这 也 将 引发 原本 站 立 此 处 的 人 们 同 向 移动 。 如 此 一 来 ,大 家 都 在 尽量 往 前 
移 。 而 在 出 租车 到 达 之 前 ,可 能 根本 没有 一 个 均衡 一 一 没有 一 个 人 甘心 待 在 两 区 之 间 任 
赁 别人 排挤 出 局 。 


实际 上 ,这 是 一 个 各 自 独 立 的 、 非 合作 的 决策 过 程 。 我 们 也 能 从 中 看 到 决策 的 低 效 
率 。 在 极端 条 件 下 ,这 类 决策 过 程 可 能 得 不 出 一 个 确定 的 结果 。 遇 到 这 种 情况 ,就 需要 找 
出 一 种 协调 方式 ,达到 一 个 稳定 的 结果 ,和 否则 会 对 社会 秩序 和 生产 生活 造成 很 大 影响 。 

从 上 述 两 个 案例 中 可 以 看 到 非 协调 竞争 博弈 具有 均衡 不 确定 性 和 低 效 率 等 刺 端 。 无 
论 从 个 人 利益 还 是 集体 利益 角度 来 看 , 非 协调 竞争 博弈 都 无 法 给 出 一 个 令 人 满意 的 结 
这 恰恰 证 明了 协调 的 必要 性 。 协 调 会 给 博弈 结果 带 来 哪些 补益 呢 ? 我 们 来 看 两 个 通过 协 
调 方式 达成 决策 ,成 功 提高 绩效 的 典型 案例 。 


过 证 案例 8-3: 常春 藉 联 校 


20 世纪 50 年代, 美国 的 常春 藤 联 校 面临 一 个 问题 。 每 个 学 校 都 想 训 出 一 支 战 无 不 
胜 的 橄榄 球 队 ,结果 各 个 学 校 为 了 建立 一 支 优 秀 的 球 队 而 过 分 强调 体育 ,忽略 了 学 术 水 
准 。 不 过 ,无 论 各 队 怎 样 勤奋 训练 ,各 校 怎样 慷慨 资助 ,赛季 结束 的 时 候 各 队 的 排名 却 和 
以 前 差不多 。 平 均 胜 负 率 还 是 50/50。 一 个 难以 逃避 的 数学 事实 是 ,有 一 个 胜 者 就 要 有 
一 个 负 者 。 对 输 的 球 队 而 言 , 所 有 的 加 倍 苦 练 都 会 付 诸 东 流 。 大 学 体育 比赛 的 刺激 性 取 
决 于 两 个 因素 ,一 是 竞争 的 接近 程度 和 激烈 程度 ; 二 是 技巧 水 平 。 与 职业 比赛 相 比 , 尽 管 
大 学 体育 比赛 的 技巧 水 平 可 能 稍 低 一 些 ,但 是 竞争 却 更 激烈 .更 紧张 ,所 以 许多 球迷 喜欢 
看 大 学 篮球 比赛 和 橄榄 球 比 赛 。 认 清 胜 败 乃 球场 常事 .各 大 学 也 不 再 为 比赛 急功近利 。 
他 们 组 织 起 来 ,达成 协议 ,将 春季 训练 限定 为 一 天 时 间 。 虽 然 球场 上 出 现 了 更 多 失误 ,但 
球赛 的 刺激 性 一 点 儿 也 没 减少 ,运动 员 也 有 更 多 的 时 间 准 备 功课 ,各 方 的 结果 都 比 原来 更 
好 一 一 除非 你 希望 他 们 忘记 学 业 而 只 想 夺 冠 。 
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这 个 例子 的 特征 在 于 ,成 功 取决 于 相对 成 绩 而 非 绝对 成 绩 。 如 果 一 名 参与 者 改善 了 
自己 的 排名 ,那么 必然 有 另 一 个 人 的 排名 变 差 。 不 过 ,这 个 例子 并 不 是 零 和 博弈 。 零 和 博 
弈 不 会 出 现 所 有 人 都 得 到 更 好 结果 的 情况 ,但 这 个 例子 中 却 有 可 能 ,因为 所 有 参与 者 的 投 
入 都 减少 了 。 尽 管 胜 者 和 负 者 的 数目 一 定 , 但 对 于 所 有 参与 者 而 言 ,参加 这 个 博弈 的 代价 
降低 了 。 

当下 处 于 社会 关注 焦点 的 “中 小 学 减负 ”问题 与 上 述 例子 类 似 。 在 现行 的 高 考 制度 
下 ,假如 其 他 学 校对 学 生 减 负 ,一 个 学 校 的 最 好 选择 是 不 减负 。 如 果 这 么 做 ,该 学 校 会 得 
到 更 高 的 升学 率 和 知名 度 ,进而 取得 教育 主管 部 门 给 予 的 其 他 各 方面 的 资源 。 如 果 其 他 
学 校 不 减负 ,那么 该 学 校 的 最 佳 选 择 也 是 不 减负 ,否则 该 学 校 的 升学 率 就 会 降低 。 每 个 学 
校 都 从 自己 的 利益 出 发 ,做 出 的 最 佳 选择 都 是 不 减负 。 结 果 , 各 个 学 校 的 升学 率 并 没有 得 
到 大 幅 提升 ,而 学 生 的 负担 却 越 来 越 重 。 这 一 囚徒 困境 的 破解 ,就 要 依靠 教育 部 出 台 政 
策 ,限制 学 校 不 合理 补课 等 行为 。 


有 扩展 阅读 

据 《 光 明日 报 )2017 年 2 月 15 日 的 报道 ,上 海 两 项 奥数 竞赛 在 新 学 期 开学 前 宣布 停 
办 。 在 14 日 发 布 的 停办 公告 中 ,竞赛 活动 组 委 会 均 称 ,此 举 是 为 认真 贯彻 上 海 市 教委 关 
于 “减负 ”的 有 关 会 议 精 神 , 将 减负 进一步 夯实 ,这 也 成 为 上 海 市 教委 送 给 全 市 137 万 中 小 
学 生 的 新 学 期 "礼物 ”。 

上 海 市 教委 明确 规定 : 2 月 16 日 开学 后 两 周 内 中 小 学 不 得 组 织 任何 形式 带 有 学 科 测 
试 性 质 的 练习 、 测 验 、 考 试 等 ,新 学 期 将 试点 作业 、 考 试 (测验 ) 备 案 制 。 学 校 承担 "减负 ” 工 
作 的 直接 责任 ,“ 减 负 ” 的 意识 和 规范 要 落实 到 每 一 所 学 校 和 每 一 位 教师 ,探索 建立 校长 、 
教师 信誉 档案 ,对 督导 检查 、 信 访 等 渠道 发 现 的 "阴阳 课表 ”、 违 规 考试 和 测试 ,组织 跨 校 联 
考 .教师 有 偿 补课 .与 校外 培训 机 构 存 在 利益 输送 等 违规 的 相关 责任 人 记 入 信誉 档案 , 试 
行 不 经 备案 布置 作业 也 记 入 信誉 档案 ,与 教师 职务 晋升 .职称 评定 、 岗 位 聘用 、 评 优 评 先 、 
选拔 培养 ,绩效 考核 等 进行 挂 钓 。 


过关 案例 8-4: 令 人 左右 为 难 的 路 线 


对 于 在 上 海 市 人 民 广 场 附近 工作 的 小 米 来 讲 , 到 虹桥 机 场 T2 航 站 楼 有 两 条 主要 路 
线 可 以 选择 : 一 是 自己 驾车 或 搭乘 出 租车 走 延安 高 架 路 ; 二 是 搭乘 地 铁 , 即 “乘坐 地 铁 
2 本 并"。 

走 延安 高 架 路 的 距离 短 、 红 绿灯 少 ,顺畅 时 只 需 20 分 钟 即 可 到 达 。 但 很 少 能 遇 到 这 
种 好 运 。 延 安 高 架 路 虽 是 双向 8 车 道 , 但 经 常 “ 车 满 为 患 ?。 假 设 ( 每 小 时 ) 每 额外 增加 
2 000 辆 车 ,就 会 耽搁 路 上 每 个 人 10 分 钟 的 时 间 。 例 如 ,有 2000 辆 车 的 时 候 ,行程 时 间 
就 延长 至 30 分 钟 ; 若 有 4 000 辆 车 , 则 延长 至 40 分 钟 。 

乘坐 地 铁 共 有 9 站 ,而 且 乘 客 必 须 走 到 车 站 等 车 。 客 观 地 说 ,这 条 路 线 也 要 将 近 
40 分 钟 。 但 是 地 铁 准 时 , 极 少 堵塞 或 发 生 事故 。 若 是 乘客 多 了 ,稍微 拥挤 也 能 忍受 ,通行 
时 间 有 保障 。 
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那么 ,小 米 将 会 面临 一 个 怎样 的 局 面 呢 ? 


假如 在 运输 高 峰 时 间 有 1 万 人 走 在 从 人 民 广 场 到 虹桥 机 场 T2 航 站 楼 的 路 上 ,如 
图 8-1 所 示 , 这 些 人 将 会 怎样 分 布 在 这 两 条 路 线 上 呢 ? 每 个 人 都 会 考虑 自己 的 利益 ,选择 
最 能 缩短 自己 通行 时 间 的 路 线 。 假 如 让 他 们 自己 决定 , 则 他 们 会 在 不 停 的 重复 中 试探 出 
以 下 均衡 : 40% 的 人 自己 驾车 ,60% 的 人 搭乘 地 铁 。 此 时 ,两 种 路 线 无 差异 ,通行 时 间 都 
是 40 分 钟 。 
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图 8-1 上 海 市 人 民 广场 至 虹桥 机 场 T2 航 站 楼 的 两 条 路 线 


如 果 这 个 比例 发 生变 化 ,结果 会 有 什么 变化 ?让 我 们 进一步 讨论 。 假 定 只 有 2 000 
人 愿意 开车 走高 架 路 。 由 于 车 辆 较 少 ,交通 比较 顺畅 ,这 条 路 线 的 通行 时 间 也 会 缩短 ,只 
需 30 分 钟 。 于 是 ,搭乘 地 铁 2 号 线 的 8 000 名 乘客 中 ,有 一 些 就 会 发 现 , 改 为 开车 他 们 可 
以 节省 时 间 ,于 是 他 们 就 会 选择 开车 。 相 反 , 若 有 8 000 人 选择 开车 走高 架 路 ,每 个 人 要 
花 60 分 钟 才 能 到 达 目 的 地 ,于 是 ,当中 又 有 一 部 分 人 会 改 为 乘 地 铁 ,因为 乘 地 铁 花 的 时 间 
没 那么 长 。 但 是 , 当 有 4 000 人 开车 上 了 高 架 路 ,6 000 人 搭乘 地 铁 时 ,这 个 时 候 谁 也 不 会 
由 于 改 走 另 一 条 路 线 而 节省 时 间 一 一 路 上 出 行者 达到 了 一 个 均衡 。 

我 们 可 以 借助 一 张 简 图 来 描述 这 个 均衡 (图 8-2)。 图 中 ,我 们 使 总 通行 人 数 保 持 为 1 
万 人 不 变 。 这 样 , 当 有 2 000 人 正 开车 通过 高 架 路 时 ,表示 有 8 000 人 正在 搭乘 地 铁 。 上 
升 的 直线 表示 走 延 安 高 架 路 的 通行 时 间 如 何 随 开 车 人 数 的 增加 而 增加 。 水 平 直线 则 表示 
搭乘 地 铁 所 需 的 固定 不 变 的 40 分 钟 时 间 。 两 条 直线 相交 于 一 点 ,表明 当 开 车 走 延 安 高 架 
路 的 人 数 为 4000 时 ,两 条 路 线 的 通行 时 间 相 等 。 

然而 这 个 均衡 对 出 行者 们 来 说 并 非 整 体 最 佳 。 我 们 很 容易 就 能 找到 一 个 更 好 的 模式 。 
假设 只 有 2 000 人 选择 走 延 安 高 架 路 。 他 们 每 个 人 可 节省 10 分 钟 。 至 于 另外 2 000 名 改 乘 
地 铁 的 人 ,他 们 花 的 时 间 仍 然 和 原来 开车 的 时 候 一 样 ,还 是 40 分 钟 。 另 外 6 000 名 已 经 选择 
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乘坐 地 铁 的 人 也 是 如 此 。 这 样 总 的 通行 时 间 就 节省 了 2 万 分 钟 (几乎 等 于 两 个 星期 )。 

当 这 些 出 行者 作为 一 个 整体 的 时 候 , 怎 样 的 出 行 模式 才 是 最 佳 的 呢 ? 实 际 上 ,刚刚 所 
确定 的 那个 模式 , 即 *2000 人 开车 走 延 安 高 架 路 ,总 共 节 省 2 万 分 钟 ” 的 模式 就 是 最 佳 模 
式 。 为 了 进一步 理解 这 一 点 ,我 们 再 看 看 另外 两 个 方案 。 假 如 有 3 000 辆 车 通过 延安 高 
架 路 , 则 通行 时 间 就 是 35 分 钟 , 每 个 人 节省 5 分 钟 ,总 共 节 省 15 000 分 钟 。 假 如 只 有 
1 000 辆 车 通过 高 架 路 , 则 通行 时 间 是 25 分 钟 ,每 人 节省 15 分 钟 ,总 共 节 省 时 间 还 是 
15 000 分 钟 。 因 此 ,2 000 人 选择 走高 架 路 ,每 人 节省 10 分 钟 的 中 间 点 就 是 最 佳 模式 。 

如 何 才能 达到 这 种 效果 呢 ? 换言之 , 需 通过 什么 样 的 机 制 来 引导 他 们 达成 最 佳 混合 
路 线 的 结果 呢 ? 关键 就 在 于 每 一 个 使 用 高 架 路 的 人 给 其 他 人 带 来 的 伤害 。 每 增加 一 个 人 
选择 这 条 路 线 ,其 他 人 的 出 行 时 间 就 会 随 之 延长 。 但 是 新 增加 的 出 行者 却 不 必 为 导致 这 
一 损耗 而 付出 代价 ,他 只 是 考虑 自己 的 通行 时 间 。 让 我 们 仿照 京 沪 两 地 对 小 客车 牌照 的 
处 理 方法 来 讨论 : 北京 的 摇号 制度 和 上 海 的 拍卖 制度 。 

(1) 仿照 摇号 制度 , 某 些 计划 部 门 打 算 发 出 2 000 份 使 用 高 架 路 的 许可 证 。 但 是 哪些 
人 将 持 有 许可 证 呢 ? 持 有 许可 证 的 人 只 要 30 分 钟 就 可 到 达 目 的 地 ,而 没有 许可 证 的 另外 
8 000 人 则 要 花费 40 分 钟 。 因 此 ,这 种 做 法 将 招来 不 公平 。 实 际 上 ,他 们 可 以 设计 一 个 抽 
签 轮换 系统 ,保证 许可 证 每 个 月 轮换 一 次 ,在 这 1 万 人 之 间 随 机 抽取 。 

(2) 类 似 拍 卖 制度 ,希望 通过 市 场 调 节 的 部 门 则 要 求人 们 为 自己 对 别人 所 造成 的 伤 
害 买单 。 假 设 大 家 认为 每 小 时 的 时 间 价 值 为 12 元 ,换言之 ,每 个 人 都 愿意 为 节省 1 刻 钟 
而 支付 3 元。 于 是 我 们 可 以 向 走 延 安 高 架 路 的 车 辆 收取 通行 费 , 收 费 标准 比 地 铁 票 价 高 
出 2 元 。 这 是 因为 根据 假设 条 件 , 人 们 认为 每 多 花 10 分 钟 等 于 损失 2 元 。 在 均衡 状态 下 
将 有 2 000 辆 车 走高 架 路 ,8 000 人 选择 搭乘 地 铁 。 每 一 个 通行 延安 高 架 路 的 人 要 花 30 
分 钟 到 达 目 的 地 ,外 加 多 花 2 元 的 高 架 通 行 费 ; 每 个 搭乘 地 铁 的 人 则 要 花 40 分 钟 。 总 的 
实际 成 本 是 一 样 的 ,没有 人 想 要 转换 成 另 一 种 路 线 。 在 这 个 过 程 中 我 们 收取 了 4 000 元 
通行 费 ( 外 加 2 000 张 地 铁 票 的 收入 ) ,这 笔 钱 可 以 纳入 国家 预算 ,造福 国民 。 

(3) 一 个 更 接近 自由 企业 精神 的 解决 方案 是 允许 某国 有 单位 拥有 高 架 路 。 大 桥 所 有 
者 意识 到 人 们 愿意 花 钱 换取 一 条 不 怎么 堵塞 的 路 线 , 以 节约 通行 时 间 。 因 此 他 就 会 为 这 
一 特权 开 出 一 个 价 。 如 何 才能 使 自己 的 收入 最 大 化 呢 ? 即 如 何 使 节省 的 时 间 所 对 应 的 价 
值 最 大 化 ? 
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只 有 给 宝贵 的 “通行 时 间 ” 标 上 价格 ,才能 引导 人 们 选择 “价值 最 大 化 ”的 通行 模式 。 
一 旦 高 架 入 口 处 安装 了 利润 最 大 化 的 收费 站 .时间 就 真 的 变 成 了 金钱 。 搭 乘 地 铁 者 实际 
上 是 在 向 这 些 使 用 高 架 道 路 者 出 售 时 间 。 当 然 ,收取 通行 费 的 成 本 有 时 超出 了 节约 大 家 
出 行 时 间 所 带 来 的 收益 。 创 造 一 个 市 场 并 非 免费 的 午餐 。 收 费 站 本 身 可 能 就 是 导致 交通 
堵塞 的 主要 源头 之 一 。 若 是 这 样 ,忍受 最 初 不 那么 高 效 的 路 线 选 择 可 能 还 好 一 些 。 

上 述 情境 只 是 城市 交通 管理 的 一 个 缩影 。 读 者 可 以 将 路 线 选择 与 规划 问题 具体 化 、 
网 络 化 。 就 制度 设计 而 言 ,无 论 是 刚 开始 的 机 会 均等 方案 还 是 最 后 的 有 偿 使 用 方案 ,在 国 
内 城市 交通 治理 中 都 有 所 采用 ,如 北京 的 车 牌 摇号 制度 和 上 海 的 车 牌 拍卖 制度 等 。 当 然 ， 
交通 管理 部 门 也 在 尝试 其 他 的 制度 ,如 某 时 段 限制 某 类 型 的 车 辆 驶 人 高 架 路 等 。 


LE 扩展 阅读 : 高 速 拥堵 之 痛 何 时 消 


北京 首都 国际 机 场 (简称 "首都 机 场 ”) 年 旅客 吞吐 量 位 居 亚 洲 第 1 位 、 全 球 第 2 位 ,是 
中 国 的 室 中 门户 和 对 外 交流 的 重要 窗口 。 从 北京 市 区 到 首都 机 场 航 站 楼 主要 有 两 种 交通 
方式 ,一 种 是 搭乘 地 铁 机 场 线 ; 另 一 种 是 走 机 场 高 速 。 

地 铁 机 场 线 由 市 区 的 东直门 至 北京 首都 国际 机 场 , 全 长 28. 1 公里 ,全 程 票 价 为 人 民 
币 25 元 。 作 为 公共 交通 工具 的 地 铁 , 有 着 方便 、 快 捷 、 经 济 等 诸多 优点 。 但 是 “ 挤 得 像 沙 
丁香 饶 头 一 样 的 地 铁 , 需 要 拖 着 行李 不 断 奔 波 的 机 场 快 轨 …… ”。 在 一 段 时 间 内 ,公共 交 
通 依然 让 我 们 太 多 人 感到 : 想 说 爱 你 不 容易 ! 因此 在 大 多 数 人 眼中 ,机 场 高 速 仍 是 第 一 
选择 。 

应 广大 车 主 的 要 求 ,北京 市 于 2009 年 和 2011 年 先后 两 次 降低 了 机 场 高 速 公路 的 收 
费 标准 。 出 京 方向 高 速 公路 收费 降 为 半价 , 进 京 方向 全 面 停止 收费 。 这 种 做 法 取得 了 一 
定 的 社会 效益 。 

但 是 , 随 着 收费 政策 的 调整 ,机 场 高 速 公路 车 流量 大 幅度 增长 ,拥堵 状况 加 剧 ,以 至 于 
高 速 路 最 终 变 成 了 “ 龟 速 路 ”。 数 据 显示 ,2011 年 三 季度 机 场 高 速 自然 交通 流量 环比 上 升 
了 40%, 每 天 增加 了 近 6 万 车 次 。 在 减免 收费 以 前 ,机 场 高 速 进 京 最 堵 的 路 段 是 苇 沟 至 
五 环 路 。 每 天 拥堵 时 间 从 下 午 4 点 开始 ,到 6 点 半 基 本 缓解 。 但 是 降低 收费 后 这 段 路 基 
本 全 天 拥堵 。 

面 对 拥 堵 的 交通 ,有 些 人 提出 : 重新 恢复 收费 吧 ! 这 种 观点 是 否 合理 呢 ? 支持 这 种 
观点 的 人 认为 : 面 对 稀缺 的 道路 资源 ,我 们 只 能 使 用 价格 的 杠杆 。 从 交通 学 原理 上 说 , 堵 
车 本 身 就 是 一 种 时 间 成 本 。 从 这 个 角度 讲 , 用 金钱 购买 时 间 也 未 尝 不 可 。 

但 是 ,反对 者 认为 这 种 做 法 显然 违背 了 当初 取消 收费 的 初衷 。 据 不 完全 统计 ,全 世界 
收费 公路 在 14 万 公里 左右 ,而 我 国 就 占 了 10 万 公里 。 国 内 公路 .高速 公路 收费 已 经 引得 
司机 们 怨声载道 。 因 此 ,首都 机 场 高 速 减免 收费 曾经 被 看 作 一 种 进步 。 在 广大 群众 看 来 ， 
重新 收费 万 万 要 不 得 。 

是 否 应 该 恢复 收费 呢 ? 要 回答 上 述 问题 ,或 许 先 要 回答 : 重新 收费 真 的 可 以 治本 吗 ? 

事实 上 ,城市 交通 拥堵 是 世界 每 一 个 国家 都 面临 的 困扰 。 目 前 ,北京 的 面积 是 东京 的 
8 们 ,人 口 只 是 东京 的 近 两 信 。 两 座 城 市 的 汽车 保有 量 基本 相当 。 换 和 句 话说 ,北京 的 人 口 
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密度 只 是 东京 的 1/4, 人 均 汽车 保有 量 是 东京 的 1/2。 那 么 ,为 什么 人 均 汽 车 保有 量 高 一 
们 的 东京 一 路 畅通 ,而 北京 却 严重 拥堵 呢 ? 归根 结 底 ,我 们 在 道路 设计 和 管理 上 存在 一 些 
问题 。 重 新 收费 恶 怕 只 能 缓解 一 时 之 痛 , 却 难以 对 症 下 药 、 解 决 根 本 问题 。 解 决 机 场 高 速 
交通 拥堵 问题 还 是 要 从 完善 综合 运输 规划 布局 出 发 ,多 方式 、 多 途径 、 多 角度 地 予以 解决 。 


无 论 从 实验 统计 还 是 社会 观察 ,都 存在 诸多 行为 偏离 了 非 合作 均衡 的 理论 预测 。 当 
然 ,这 并 不 能 促使 我 们 放弃 对 非 合作 博 穿 的 学 习 , 而 是 在 此 基础 上 尝试 新 的 研究 。 一 般 来 
讲 , 非 合作 博 穿 思维 将 导致 激烈 的 竞争 与 冲突 。 然 而 ,合作 乃 是 人 类 更 高 层次 的 智力 活 
动 , 与 此 同时 ,人 类 的 智力 发 展 又 将 促 生 新 形式 的 合作 。 目 前 ,在 经 济 学 范畴 对 合作 行为 
的 研究 主要 采用 3 种 方法 或 称 3 个 分 支 : 考虑 社会 偏好 (如 公平 .互惠 利他 ,报复 惩 罚 等 ) 
的 影响 .重复 和 演化 思想 ,以 及 ”合作 博 弈 ?理论 。 第 一 个 分 支 是 在 非 合作 博弈 的 基础 上 学 
试 对 所 观察 到 的 行为 多 样 性 建立 统一 的 解释 。 它 的 前 提 仍 然 是 建立 在 效用 理论 的 基础 之 
上 ,将 参与 主体 的 决策 偏好 体现 在 效用 函数 里 ,而 非 传统 意义 上 的 "唯利是图 "。 第 二 个 分 
支 是 采用 重复 博弈 和 进化 论 的 思想 ,利用 生物 学 .社会 学 .人 类 学 .数学 等 知识 描述 合作 的 
演化 。 尽 管 重复 博弈 和 演化 博弈 是 两 个 不 同 的 概念 ,但 是 在 研究 合作 行为 的 演化 时 ,二 者 
常常 合用 ,并 无 明确 的 界限 ,所 以 将 二 者 归 入 一 类 。 在 第 6 和 第 7 章 ,读者 已 经 体验 到 如 
何 利 用 重复 博弈 和 演化 博弈 解释 合作 行为 。 第 三 个 分 支 是 非常 成 熟 的 理论 , 即 “ 合 作 博 
弈 理论。 合作 博弈 几乎 与 非 合 作 博 弈 同时 诞生 ,而 且 不 受 非 合 作 博 弈 的 思维 影响 ,二 者 
相对 独立 。 总 体 来 讲 ,3 个 分 支 各 有 所 长 。 作 为 大 学 通 识 教育 ,有 必要 让 读者 对 每 种 方法 
都 有 所 了 解 。 接 下 来 的 三 节 内 容 将 分 别 介绍 公平 偏好 、 合 作 的 演化 与 合作 博弈 。 


8.2 公平 已 深入 人 心 


在 现实 中 ,人 的 自私 性 所 带 来 的 行为 数不胜数 ,无 须 效 述 。 自 私 是 人 生存 的 基础 。 在 
西方 的 传统 科学 如 经 济 学 中 也 总 是 假定 * 人 是 理性 的 "。 也 就 是 说 ,人 总 是 而 且 只 为 其 自 
身 利益 考虑 。 但 读者 不 难 发 现在 社会 现实 中 有 大 量 的 “利他 ?现象 存在 。 阿 里 巴巴 的 马云 
曾 说 : 先 帮 助 他 人 赚钱 ,等 他 们 赚 到 钱 了 ,再 从 中 分 一 杯 姜 。 而 企业 在 招聘 员工 时 ,非常 
看 重 的 一 点 即 人 的 合作 性 。 

近 20 年 来 ,现代 科学 技术 的 发 展 已 经 从 生物 学 角度 证 明了 人 的 本 性 中 存在 利他 (或 
公平 ) 成 分 。 瑞 士 苏黎世 大 学 经 济 学 实证 研究 院 主 任 厄 恩 斯 特 。 费 尔 与 美国 南 佛罗里达 
医学 院 的 研究 人 员 曾 主持 了 一 项 实验 研究 .发 现 人 类 大 脑 额 叶 前 部 外 侧 皮 层 右 侧 存 在 一 
个 “自私 开关 ”, 能 帮助 人 们 在 显 失 公平 (一 方 过 于 自私 ) 的 情况 下 抑制 自私 冲动 ,即便 这 样 
会 损害 他 们 的 既得 利益 。 同 时 ,美国 艾 默 瑞 大 学 的 学 者 们 则 证 实 了 利他 是 一 个 “基因 一 文 
化 "共同 演进 的 过 程 , 并 且 逐 步 内 化 为 社会 规范 。 人 人 利己 时 ,往往 会 形成 竞争 的 局 势 ; 
而 出 现 利 他 时 ,更 有 可 能 形成 合作 的 局 面 。 在 现代 社会 中 , 利 已 与 利他 共存 ,竞争 与 合作 
共存 ,相依 相生 已 成 为 常态 。 

公平 性 与 利他 性 ,是 人 们 在 互动 行为 中 所 考虑 的 最 为 重要 的 两 个 非 自 私 因 素 。 利 他 
和 公平 的 信念 都 能 够 导致 人 类 的 合作 行为 一 一 准确 地 讲 , 利 他 和 公平 都 是 对 人 类 合作 行 
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为 的 一 种 尝试 性 解释 ,但 不 是 唯一 的 解释 ,只 是 出 发 点 不 同 而 已 。 因 此 ,本 章 仅 介绍 公平 
部 分 ,利他 部 分 留待 读者 课外 阅读 。 此 外 .有 兴趣 的 读者 也 可 参考 与 此 有 关 的 新 近 成 果 或 
文献 书籍 。 

现 有 文献 中 的 互动 行为 模型 大 都 假设 参与 者 是 理性 的 , 即 完 全 追求 自身 的 利益 而 不 
关心 他 人 利益 。 但 在 此 假设 下 ,对 某 些 博弈 均衡 策略 的 预测 并 非 全 部 与 事实 吻合 。 这 说 
明 自 私 理性 的 假设 并 不 适用 于 所 有 场合 。 实 际 上 ,人 类 自古 就 有 “不 患 寡 而 患 不 均 ” 的 认 
识 , 即 反对 “不 公 ”。 无 须 袭 述 , 公 平 是 人 类 社会 中 一 个 非常 重要 的 概念 , 它 几 乎 体现 在 我 
们 每 个 人 的 内 心中 。 恩 斯 特 。 费 尔 (Ernst Fehr) 和 施 密 特 (Schmidt) 曾 于 1999 年 很 好 地 
将 公平 信念 引入 到 博弈 论 中 来 测度 参与 者 的 效用 (简称 "公平 效用 ”) , 依 此 来 解释 实际 行 
为 与 均衡 预测 之 间 的 偏离 。 

费 尔 和 施 密 特 的 模型 基于 两 点 假设 。 第 一 ,参与 者 除了 自身 因素 之 外 ,还 存在 着 排斥 
不 公平 结果 的 因素 。 第 二 ,就 “所 得 处 于 劣势 ”( 比 别人 的 所 得 低 ) 与 “所 得 处 于 优势 "( 比 别 
人 的 所 得 高 ) 这 两 种 不 公平 来 讲 , 参 与 者 更 排斥 “所 得 处 于 劣势 "?。 本 书 分 别称 作 “ 劣 势 不 
公 ” 和 “优势 不 公 ”。 

他 们 将 上 述 两 点 反映 在 参与 者 的 效用 中 ,重新 分 析 了 最 后 通 秋 博弈 市场 竞 争 博弈 
(包括 出 价 者 竞争 和 应 价 者 竞争 两 种 情况 ) 以 及 合作 博弈 等 ,所 得 结果 能 够 很 好 地 解释 看 
似 相 互 矛盾 的 一 些 现 象 。 举 例 说 明 如 下 。 

(1) 在 最 后 通 册 博弈 中 ,博弈 均衡 与 理性 假设 下 的 均衡 预测 有 很 大 差别 。 如 果 不 公 
存在 且 差 别 很 大 的 话 , 某 些 参与 者 特别 是 “劣势 不 公 ” 占 主导 的 参与 者 就 会 偏离 所 谓 的 “ 均 
衡 ", 采 取 “ 破 坏 性 ”行动 ,使 双方 的 收入 变 得 更 糟 。 但 是 , 它 却 很 好 地 体现 了 公平 动机 对 参 
与 者 行动 的 影响 。 

(2) 在 出 价 者 竞争 的 市 场 博弈 中 ,加 入 公平 效用 后 ,所 得 结果 仍 与 自私 理性 假设 下 的 
均衡 结果 相同 ,并 与 实验 观察 相 吻 合 。 究 其 原因 ,在 于 自私 理性 假设 下 的 结果 已 经 很 公平 
了 ,即使 引入 公平 信念 也 不 能 使 得 均衡 有 所 变化 。 但 在 应 价 者 竞争 的 市 场 博弈 中 ,在 引入 
公平 效用 后 ,其 结果 会 发 生 些微 变化 。 

(3) 在 合作 博弈 中 公平 效用 将 发 挥 更 重要 的 作用 。 研 究 表 明 , 反 对 不 公 能 够 改善 自 
愿 合作 的 愿景 。 特 别 是 在 某 些 条 件 下 ,自私 理性 假设 下 的 企业 会 由 完全 背叛 转变 为 完全 
合作 。 而 在 引入 了 公平 效用 后 ,模型 描述 更 接近 实际 ,也 可 以 更 好 地 预测 实验 结果 。 

费 尔 和 施 密 特 提出 的 公平 效用 ,也 即 简 单 地 反对 不 公 , 模 型 如 下 。 设 有 一 个 博弈 具有 
nn 个 参与 者 ,分 别 记 作 1,2,…,n; 令 二 (x1,X2，"…,Tn) ,表示 个 参与 者 在 博弈 中 所 获 
得 的 收入 组 合 。 则 在 考虑 公平 因素 的 情况 下 ,第 i 个 参与 者 的 效用 函数 可 表示 为 

Ui(X) = Xxi—ai 一 1 3 (zj — x+— Bp; 一 i > (zi—Zzi)t,0 CB <max{l,ai} 
其 中 x1 二 max{x,0) 表 示 xz 的 正 部 。 在 上 式 中 ,第 二 部 分 表示 由 “劣势 不 公 ” 所 引起 的 效 
用 损失 , 即 所 有 比 i 收 入 高 的 参与 者 与 i 的 收入 差距 总 和 对 i 的 效用 影响 ; 第 三 部 分 表示 
由 “优势 不 公 ” 所 引起 的 效用 损失 , 即 所 有 比 i 收 入 低 的 人 与 i 的 收入 差异 总 和 对 i 的 效用 
的 影响 。 系 数 wi ,B; 表明 两 类 收入 不 公 都 会 降低 参与 者 i 的 效用 。 
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除了 上 述 假设 外 , 另 一 个 合理 的 假设 是 ai; 宇 B 宇 0, 因 为 观察 表明 “劣势 不 公 ” 对 参与 
者 i 的 效用 损失 影响 比 “ 优 势 不 公 ”的 要 大 。 而 B: 宇 0 则 完全 排除 了 “完全 喜欢 自己 的 收入 
比 别 人 高 的 参与 者 ”。B 二 1 是 因为 下 述 原 因 。 不 妨 假设 Bi 二 0. 5 ,表示 参与 者 i 在 保留 1 
元 钱 和 将 这 1 元 钱 给 比 自己 收入 低 的 参与 者 j 这 两 个 行动 之 间 表现 出 无 差异 , 即 效 用 画 
数值 相等 ; 车 B 二 1, 则 i 宁愿 将 1 元 钱 给 比 自己 收入 低 的 j, 以 增加 效用 。pBi; 宇 1 于 情理 
不 通 , 在 这 里 不 做 研究 。a; 并 没有 上 界 的 要 求 , 在 这 里 可 以 理解 为 : 车 ai 值 很 大 , 则 参与 
者 i 特别 忌妒 别人 收入 比 自己 高 :他 愿意 放弃 1 元 钱 的 收入 ,以 便 让 比 自己 收入 高 的 参与 
者 的 收入 减少 (十 ai)/ai;。 例 如 , 当 ai 二 0.5 时 ,参与 者 j 的 收入 减少 1.2 元 。 

读者 在 进 阶 阅读 中 将 看 到 , 若 将 上 述 公 平 效 用 函数 应 用 于 最 后 通 委 博弈 和 有 出 价 者 
竞争 的 市 场 博弈 , 则 所 得 结论 能 够 很 好 地 解释 一 些 看 似 相 互 矛盾 的 现象 。 


Ge， :; 读 , 公平 J 放 
WwW 进 阶 阅 读 : 公平 效用 模型 的 应 用 


1. 最 后 通 腾 博弈 

最 后 通 肛 博弈 是 指 两 个 参与 人 就 利润 分 配 所 进行 的 博弈 。 假 设 参与 者 1 提出 分 配 
给 参与 者 2, 自 己 得 1 一 s。 若 参与 者 2 接受 , 则 按 此 方案 进行 分 配 ; 否则 ,两 个 参与 者 所 得 
均 为 0。 

根据 博弈 论 相关 知识 ,可 知 在 参与 者 均 是 自私 理性 的 假设 下 ,此 博弈 的 子 博弈 完美 均 
衡 是 : 参与 者 1 自己 几乎 得 1, 而 参与 者 2 得 任意 小 的 正 量 e( 取 其 极限 值 则 为 0) 。 但 是 ， 
试验 结果 远 非 如 此 。 事 实 上 ,试验 表明 ; 

(1) 没有 发 生 过 二 0.5 的 情况 。 

(2) 在 多 数 情况 下 ,有 5sE(0.4,0.5]。 

(3) s 过 0.2 的 情况 几乎 没有 出 现 。 

(4) s 越 小 则 被 参与 者 2 拒绝 的 可 能 性 越 大 ,被 拒绝 的 概率 随 s 的 增加 而 递减 。 

在 引入 公平 信念 后 ,可 得 出 如 下 与 试验 观察 相符 的 理论 结果 。 

(1) 对 于 参与 者 2, 当 sS<s (az) 时 [其 中 s(az) 二 az/(1 十 2az) 一 0.5] 拒 绝 ,而 当 ;之 
S (az ) 时 接受 。 

(2) 若 参 与 者 1 知道 参与 者 2 的 偏好 (az ,Ba), 则 参与 者 1 提供 如 下 策略 : 


0.5， Bi>0.5 
s* =4ELs (us),0.5], Pi=0.5 
= s (a2), B=0.5 


(3) 车 参与 者 1 不 知道 参与 者 2 的 偏好 ,但 相信 oz 是 服从 [a,aj] 上 累计 分 布 为 F(az) 


的 随机 变量 , 则 s 二 0.5 被 接受 的 概率 为 
i s 宇 5s (a) 


p=4F(Ta), so) <s< sa) 


Os Sea) 
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于 是 参与 者 1 的 最 优 策略 为 
OB 庆生 刀 号 
=J€ElLs (N05 商 三 人 5 
€ [os (a)], 寺 05 


有 
5 


下 做 简要 说 明 。 

首先 , 若 s 宇 0. 5, 参 与 者 2 接受 5 的 效用 是 uz 一 s 一 Bae (2s 一 1)。 因 为 对 于 Be 二 1 来 说 
接受 总 有 正 的 收入 ,而 拒绝 则 总 得 0, 所 以 接受 总 比 拒绝 好 。 关 键 在 于 ,参与 者 2 若 想 公 
平分 配 , 只 能 通过 破坏 整体 剩余 来 达到 (二 者 均 得 0) 。 当 过 0.5 时 ,参与 者 2 处 于 优势 不 
公 ，, 于 他 则 损失 巨大 ; 若 5 二 0.5, 仅 当 效 用 xz(y) 王 > 一 al(1 一 2$) 过 0 时 ,参与 者 2 才 接受 ， 
即 s 之 a2/(1 十 2a2) 二 s (az ) 。 

其 次 ,在 第 1 阶段 中 参与 者 1 绝 不 会 提出 \ 盖 0.5, 因 为 此 时 的 效用 显然 低 于 一 0.5 
时 的 效用 。 而 由 前 可 知 s 二 0.5 是 完全 平等 且 肯 定 会 被 接受 的 。 下 面 讨 论 5 三 0.5 的 
情况 。 

如 果 床 二 0.5, 则 当 s 委 0.5 时 参与 者 1 的 效用 值 随 s 严格 递增 。 这 正 是 他 愿 让 利于 
人 又 能 最 大 化 自身 收入 的 原因 ,所 以 他 将 出 价 * 一 0.5。 

如 果 脆 二 0.5, 则 参与 者 1 对 多 给 别人 1 元 还 是 自己 留 着 表现 出 无 所 谓 , 即 对 所 有 s EE 
[s (az),0.5] 无 差异 。 

如 果 语 一 0.5, 则 参与 者 1] 将 愿意 少 给 别人 而 增加 自己 的 收入 ,因而 选择 * 一 (az ) 。 
无 论 如 何 , 还 要 考虑 对 方 的 接受 上 限 。 如 果 他 完全 清楚 对 方 的 偏好 ,将 简单 地 分 配 ;二 
5 (a)。 反 之 ,车 参与 者 1 不 知道 参与 者 2 的 类 型 (偏好 ), 则 被 接受 的 概率 为 F[s/(1 一 
25)]。 进 一 步 , 当 >Y (za) 时 此 概率 为 1, 而 当 sS<s (Ca) 时 为 0。 因 此 存在 最 优 分 配 sE 
[s Ca),s (a)]。 至 此 ,可 见 上 述 结果 成 立 。 

2. 有 出 价 者 竞争 的 市 场 博弈 

假设 市 场 上 有 n 一 1 个 参与 者 (出 价 者 ) 分 别 出 价 siE[0,1],(i 一 1,2,…,m 一 1) 给 参 
与 者 nn, 参 与 者 nn 决定 是 否 接 受 最 高 出 价 F 一 maxfsi}, 若 多 个 参与 者 出 价 5, 则 以 等 概率 随 
机 接受 其 中 之 一 。 若 参与 者 nn 接受 参与 者 i 的 出 价 5, 则 他 们 两 人 的 收入 分 别 为 和 1 一 
,其 他 参与 人 的 收入 均 为 0。 反 之 , 若 参 与 者 nn 拒绝 接受 , 则 所 有 参与 者 的 收入 均 为 0。 

根据 博弈 论 知 识 可 知 ,在 自私 理性 的 假设 下 ,此 博弈 的 唯一 子 博弈 完美 均衡 是 : 至 少 
有 一 个 出 价 者 提出 5 二 1, 参 与 者 nn 独 知 全 部 收益 。 而 在 公平 效用 下 ,对 任何 参数 (qi ,Bi)， 
i 二 1,2,…,n,， 所 得 结果 仍 与 自私 理性 假设 下 的 均衡 结果 相同 ,并 且 与 试验 观察 也 相 吻 合 。 
究 其 原因 ,在 于 自私 理性 假设 下 的 结果 已 经 很 公平 了 ,即使 引入 公平 信念 也 不 能 使 得 均衡 
有 所 变化 。 在 公平 效用 下 的 均衡 结果 如 下 。 


假定 效用 函数 为 ui(s) 二 5 一 gi 一 了 Gsj 一 si)+ 一 Bi 一 了 (si 一 sj)+, 则 对 于 任 
nl re 


何 (ai,Bi) ,i 二 1,2,…,n, 存在 唯一 的 子 博弈 完美 均衡 : 至 少 有 两 个 出 价 者 提出 s 二 1, 而 
应 价 者 接受 。 
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首先 证 明 “ 至 少 有 两 个 出 价 者 提出 s 二 1 而 应 价 者 接受 之 ”确实 是 一 个 子 博 弈 完美 均 
衡 。 注 意 应 价 者 接受 任何 了 之 0.5, 因 为 
之 u jy 
3 js 15) ne (0 


欲 证 上 式 成 立 , 只 需 证 (n 一 1)F 之 Bi (n5 一 1)。 因 为 过 1, 所 以 上 式 等 价 于 (n 一 1)5 宇 
(n5 一 1)。 显 然 这 对 于 任意 的 $ 委 1 均 成 立 , 所 以 上 式 成 立 。 因 此 ,应 价 者 接受 s 二 1。 假 
设 在 其 他 出 价 者 中 至 少 有 一 个 出 价 s 二 1, 且 该 出 价 被 接受 , 则 所 有 出 价 者 均 得 0。 而且， 
没有 出 价 者 能 够 影响 这 个 结果 。 因 此 其 他 出 价 者 中 至 少 有 一 个 出 价 ;二 1。 

接 下 来 证 明 它 是 唯一 均衡 。 假 设 存在 另外 一 个 均衡 ,具有 正 概率 的 出 价 y<<1。 仅 当 
所 有 出 价 者 都 以 正 概率 出 价 s 二 1, 此 均衡 才 有 可 能 出 现 。 令 si 表示 出 价 者 i( 以 正 概率 ) 
出 价 的 最 低 值 , 则 出 价 者 i 不 可 能 将 概率 赋予 出 价 siE[Lsi,sj), 因 为 此 时 他 胜出 的 概率 为 
0。 具 体 来 讲 , 此 时 出 价 者 i 的 效用 为 
zs i sy i 
另外 ,如 果 出 价 者 选择 SiE (maxjz#i{5j ,0.5),1], 则 他 有 正 概率 胜出 ,因为 此 时 效用 为 
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生 人 ai ai 
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当然 ,也 有 i 没有 胜出 的 正 概率 ,此 时 仍 得 一 -<-。 因 此 ,i 将 偏离 此 策略 。 由 此 可 得 ,对 


| 


所 有 i 必然 是 si 一 5。 

假设 出 价 者 i 改变 策略 ,在 所 有 需要 出 价 s 的 状态 下 反而 出 价 s 十 e 过 1。 在 他 出 价 
而 胜出 时 得 1 一 s, 现 在 却 得 1 一 s 一 e。 无 论 如 何 , 令 e 任意 小 , 则 成 本 也 将 任意 小 。 然 而 收 
益 却 是 在 出 价 s 根 本 不 可 能 胜出 的 情形 中 以 出 价 s 十 e 稳定 胜出 。 此 收益 是 严格 为 正 的 ， 
并 不 随 e 趋 于 0 而 趋向 于 0。 因 此 ,5 二 1 不 可 能 是 均衡 结果 。 至 此 均衡 得 证 。 


8.3 合作 的 演化 ” 


2011 年 ,日 本 福 岛 核 电站 发 生 爆炸 后 ,一 位 20 多 岁 的 维修 工人 志愿 回 到 工厂 去 帮助 
控制 事态 。 尽 管 他 知道 空气 有 毒 , 又 无 任何 报酬 ,而 且 很 可 能 无 法 结婚 生育 ,但 他 仍然 选 
择 了 进入 工厂 “只 有 我 们 中 的 一 部 分 人 可 以 完成 这 个 工作 , "他 说 我 单身 并 且 年 轻 ,我 
觉得 解决 这 个 问题 是 我 的 责任 。” 

这 只 是 一 个 典型 的 例子 ,在 自然 界 中 无 私 的 例子 更 是 比比 丝 是 。 如 图 8-3 一 图 8-5 所 
示 , 工 蚁 相互 合作 ,共同 为 领地 工作 ; 生物 体内 的 细胞 相互 协调 来 保证 它们 的 分 裂 可 控 ， 


@ 本 小 节 由 马丁 * 诺 瓦 克 的 一 篇 文章 (合作 的 演化 ) 翻 译 整 理 而 来 ,主要 从 演化 角度 探讨 合作 的 形成 。 我 们 只 
是 从 总 体 思路 上 介绍 合作 的 演化 ,而 不 对 演化 的 机 制 做 具体 分 析 。 至 于 具体 细节 ,读者 可 参考 第 7 章 的 内 容 。 
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以 避免 致癌 ; 拥有 相同 配偶 的 母 狮子 会 哺育 彼此 的 孩子 。 人 们 也 在 各 个 方面 (从 获取 食 
物 到 寻找 配偶 再 到 保卫 领土 ) 帮 助 着 其 他 的 人 。 


图 8-3 工 蚊 合作 将 叶子 搬 回 巢穴 图 8-4 ”细胞 控制 自己 的 分 裂 以 避免 致癌 


图 8-5 ”上 肉 狮 共同 哺育 幼 狮 


几 十 年 来 ,研究 人 员 一 直 为 “合作 ”烦恼 ,前 赴 后 继 地 从 进化 论 主流 观点 一 一 “ 血 爪 腥 
牙 ”(red in tooth and claw) 来 理解 。 达 尔 文 的 自然 选择 学 说 被 称 为 “生命 最 严酷 的 斗争 ”， 
是 自然 科学 的 重要 组 成 部 分 。 在 他 的 理论 中 ,拥有 更 多 理想 性 状 的 个 体 ,将 对 下 一 代 做 出 
更 大 的 贡献 。 由 此 至 极 ,一 个 人 永远 不 可 能 帮助 对 手 , 反 之 撒谎 和 欺骗 却 能 使 他 领先 一 
步 。 无 论 使 用 何 种 手段 ,赢得 人 生 才 是 最 重要 的 。 那 么 问题 来 了 ,为 什么 无 私 的 行为 如 此 
普遍 ? 这 似乎 是 一 个 悖 论 。 

马丁 ， 诺 瓦 克 (Matin A. Nowak) 花 费 20 年 时 间 采 用 博弈 论 来 研究 这 个 明显 的 悖 
论 。 他 的 工作 表明 ,从 第 一 个 细胞 到 智 人 ,并 不 仅仅 是 对 立 竞争 在 发 挥 作 用 ,而 是 合作 竞 
争 和 对 立 竞争 共同 塑造 了 地 球 上 生命 的 演化 ,并 且 合 作对 进化 的 影响 在 人 类 中 表现 得 最 
为 明显 。 因 此 ,有 人 会 说 ,生活 不 仅仅 是 生存 斗争 ,也 是 相互 依存 。 马 丁 ， 诺 瓦 克 的 研究 
结果 说 明了 为 什么 应 该 如 此 ,而 且 强调 互相 帮助 不 仅 是 我 们 过 去 成 功 的 关键 , 它 对 我 们 的 
未 来 也 至 关 重 要 。 

马丁 * 诺 瓦 克 和 他 的 助手 利用 计算 机 来 模拟 囚徒 困境 ,研究 大 型 社区 而 不 是 局 限于 
两 名 囚犯 , 借 此 探讨 冲突 与 合作 的 关系 。 通 过 研究 ,他 们 观察 到 个 人 的 策略 在 社区 里 表现 
为 从 背叛 到 合作 再 到 背叛 的 周期 性 增长 和 下 降 循 环 。 通 过 模拟 他 们 确定 了 一 种 机 制 , 可 
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以 克服 自然 选择 中 的 自私 行为 ,让 潜在 的 背叛 者 伸手 合作 。 

开始 时 ,研究 人 员 将 背叛 者 与 合作 者 随机 分 布 。 每 轮 游戏 的 赢家 将 产生 后 代 , 后 代 将 
参加 下 一 轮 。 这 些 后 代 大 多 遵循 父母 的 策略 ,同时 随机 突变 将 改变 他 们 的 策略 。 随 着 实 
验 过 程 的 进展 ,研究 人 员 发 现 ,仅仅 在 很 小 一 部 分 的 后 代 中 ,所 有 的 个 体 在 每 一 轮 游 戏 中 
都 选择 背叛 。 一 段 时 间 之 后 ,一 个 新 的 策略 突然 出 现 : 玩家 会 开始 合作 ,然后 模仿 他 们 的 
对 手 行动 以牙还牙。 这 种 改变 迅速 形成 了 以 合作 者 为 主 的 社区 。 

这 种 参与 者 不 断 地 遇 到 其 他 参与 者 的 合作 演化 机 制 称 为 直接 互惠 。 吸 血 蝙 蝠 是 一 个 
典型 的 例子 。 如 果 一 只 蝙蝠 某 一 天 没有 猎取 到 猎物 ,那么 它 会 回 到 栖息 地 向 其 他 同伴 乞 
求 帮助 。 幸 运 的 话 , 会 有 同伴 愿意 和 它 分 享 食物 。 吸 血 蝙 蝠 生活 在 稳定 的 群体 中 ,并 且 每 
天 捕食 之 后 都 会 回 到 梨 穴 ,所 以 群体 内 的 成 员 经 常 遇 到 其 他 成 员 。 研 究 表明 ,蝙蝠 会 记 住 
曾经 帮助 过 它们 的 同伴 , 当 那 些 曾经 帮助 过 它们 的 蝙蝠 需要 食物 时 ,它们 也 会 反 过 来 提供 
帮助 。 

进一步 ,计算 机 模拟 更 表明 存在 不 同 种 类 间 的 直接 互惠 。 在 20 代 以 内 ,最 初 的 "以 牙 
还 牙 ” 策 略 将 被 新 策略 取代 。 在 新 的 策略 中 ,即使 他 们 被 对 手背 叛 , 玩 家 们 也 可 能 仍然 会 
合作 。 从 本 质 上 讲 ，“ 宽 恕 "已 经 出 现 了 , 它 是 允许 玩家 忽视 偶尔 错误 的 一 种 直接 互惠 
策略 。 

除了 直接 互惠 外 ,还 有 另外 4 种 合作 演化 的 机 制 。 不 妨 将 直接 互惠 称 为 第 一 种 演化 
机 制 。 

第 二 种 机 制 是 空间 选择 。 这 种 机 制 的 前 提 是 合作 者 和 背叛 者 在 种 群 中 分 布 不 均匀 。 
邻居 或 者 同一 个 社交 网 络 中 的 朋友 往往 互相 帮助 ,所 以 在 一 个 存在 着 零散 合作 者 的 种 群 
中 ,这 些 能 提供 帮助 的 个 人 可 以 形成 集群 ,并 不 断 扩大 ,最 终 在 与 背叛 者 的 竞争 中 获胜 。 
空间 选择 也 存在 于 简单 的 生物 体 中 。 在 酵母 细胞 中 ,合作 者 共同 生产 用 来 消化 糖 的 酶 。 
背叛 的 酵母 不 生产 酶 ,而 选择 将 大 家 共同 生产 的 酶 偷 走 。 麻 省 理工 学 院 的 杰 夫 。 戈 尔 
(Geoff Gove) 和 哈佛 大 学 的 安 德 烈 。 莫 里 (Andve Mori) 分 别 发 现 , 在 均匀 混合 的 酵母 中 
背叛 者 获胜 ; 相反 的 , 当 酵母 中 的 合作 者 和 背叛 者 非 均匀 分 布 时 ,合作 者 获胜 。 

第 三 种 机 制 是 亲缘 选择 。 这 种 方式 涉及 有 亲缘 关系 的 个 体 间 合作 ,应 该 是 最 直观 的 
无 私 合作 演化 机 制 。 在 这 种 情况 下 ,个 体 可 以 为 他 们 的 亲人 做 出 牺牲 ,因为 他 们 有 相同 的 
基因 。 尽 管 帮助 有 需要 的 亲人 也 许 会 降低 自己 的 生殖 健康 , 它 仍然 促进 了 自己 和 受 助 者 
共用 的 基因 的 传播 。20 世纪 的 生物 学 家 J. B. S. 霍 尔 丹 首 先 提 出 亲缘 选择 的 概念 ,他 说 : 
“我 会 跳 进 河 里 去 救 我 的 两 个 兄弟 或 八 个 堂 兄 弟 。" 不 过 就 理论 体系 而 言 , 人 们 往往 把 威 
廉 ， 汉密尔顿 (William Hamilton) 在 1964 年 所 提出 的 汉密尔顿 法 则 作为 亲缘 选择 理论 
的 确立 。 

第 四 种 机 制 是 间接 互惠 。 这 种 方式 和 直接 互惠 相当 不 同 。 在 间接 互惠 中 ,一 个 人 是 
否 帮 助 另 一 个 人 取决 于 他 的 名 声 。 那 些 乐于 助人 的 人 在 遇 到 困难 时 更 容易 得 到 来 自 陌生 
人 的 帮助 。 这 种 情况 下 ,合作 者 所 持 有 的 并 不 是 “以 牙 还 牙 ” 的 心理 .他 们 可 能 在 想 : 如 果 
我 帮助 了 你 ,那么 也 会 有 人 帮助 我 。 例 如 ,排名 差 的 猴子 为 排名 好 (有 好 名 声 ) 的 猴子 装扮 
(图 8-6) ,会 使 自己 的 名 声 变 得 更 好 ,然后 自己 也 将 得 到 更 多 的 装扮 。 
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图 8-6 日 本 猕猴 互相 装扮 以 提高 自己 在 群落 中 的 声誉 


最 后 , 即 第 五 种 ,个 人 可 能 会 为 了 共同 的 目的 而 为 别人 提供 帮助 ,这 种 合作 的 基础 被 
称 为 小 组 选择 。 对 这 一 机 制 的 认识 可 以 追溯 到 达尔 文 , 他 在 (人 类 的 遗传 ?中 提 到 : 一 个 
包含 很 多 人 的 部 落 ,如 果 部 落 中 的 成 员 总 是 准备 为 其 他 人 提供 帮助 ,以 及 为 部 落 共同 的 利 
益 牺 牲 自己 ,那么 这 个 部 落 将 战胜 其 他 大 多 数 部 落 ,这 就 是 自然 选择 。 自 达尔 文 之 后 , 生 
物 学 家 便 为 “自然 选择 将 推动 合作 来 提高 部 落 的 生殖 潜力 ”这 一 观点 争论 不 休 。 研 究 表 
明 ,选择 可 以 在 多 个 层次 上 发 挥 作用 ,从 个 体 基 因 到 种 群 再 到 整个 物种 。 因 此 ,同一 家 公 
司 的 员工 会 相互 竞争 以 谋求 晋升 ,但 同时 他 们 也 会 合作 来 确保 自己 所 在 的 公司 在 与 其 他 
公司 的 竞争 中 取得 胜利 。 

上 述 5 种 合作 机 制 适用 于 所 有 生物 ,从 变形 虫 到 斑马 ,甚至 在 某 些 情况 下 ,适用 于 基 
因 和 其 他 细胞 成 分 。 这 种 普遍 性 表明 ,合作 一 开始 就 是 地 球 上 生物 进化 的 推动 力量 。 而 
且 , 合 作对 人 类 的 影响 特别 深刻 。 数 百 万 年 的 进化 使 行走 缓慢 、 手 无 寸 铁 的 猿 进化 为 地 球 
上 最 有 影响 力 的 物种 : 一 个 能 够 创造 令 人 难以 置信 的 阵列 技术 ,使 人 们 能 够 探测 海洋 的 
深度 .探索 外 太空 ,一 瞬间 将 我 们 的 成 就 广播 到 全 世界 的 物种 。 事 实 上 ,只 要 我 们 愿意 ,人 
类 便 是 世界 上 最 善于 合作 的 物种 。 

合作 的 5 种 机 制 在 整个 自然 界 中 广泛 发 生 , 然 而 又 是 什么 使 得 人 类 成 为 最 乐于 助人 
的 物种 ? 这 是 因为 人 类 在 间接 互惠 和 声誉 的 基础 上 能 比 其 他 任何 一 种 生物 提供 更 多 的 
帮助 。 

为 什么 呢 ? 因为 只 有 人 类 有 成 熟 的 语言 ,并 且 每 个 人 都 有 名 字 。 这 使 得 我 们 能 够 了 
解 任何 人 的 信息 ,无 论 他 是 我 们 的 直系 亲属 还 是 地 球 另 一 面 的 陌生 人 。 我 们 常 被 诸如 "一 
个 人 对 另 一 个 人 做 了 什么 以 及 为 什么 这 么 做 ?之 类 的 问题 所 困扰 ,因为 我 们 必须 在 社交 网 
络 中 找 好 自己 的 位 置 。 研 究 表 明 , 人 们 所 决定 的 每 一 件 事 一 一 从 选择 资助 慈善 团体 到 选 
择 赞 助 公 司 一 一 都 在 一 定 程度 上 取决 于 声誉 高 低 。 丰 田 在 20 世纪 80 年 代 拥 有 超越 其 他 
汽车 制造 商 的 竞争 优势 ,一 部 分 原因 就 是 它 公 平地 对 待 供应 商 的 良好 声誉 。 

语言 和 间接 互惠 的 相互 作用 导致 了 文化 的 快速 发 展 , 这 对 于 人 类 的 适应 能 力 而 言 相 
当 重 要 。 随 着 人 类 人 口 的 扩大 和 气候 的 变化 ,我们 需要 利用 这 种 适应 性 ,并 想 办 法 联合 起 
来 拯救 地 球 和 它 的 居民 们 。 恰 好 ,博弈 理论 为 我 们 提供 了 启示 。 也 许 你 还 记得 ,涉及 多 个 
玩家 的 某 些 合作 困境 被 称 为 公共 物品 博弈 。 在 这 类 博弈 中 ,团体 中 的 每 个 人 都 受益 于 
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“我 ”的 合作 ,但 相对 地 ,“ 我 ”通过 选择 背叛 来 增加 “我 "的 收益 。 因 此 ,虽然 “我 "希望 别人 
合作 ,但 是 “我 ”聪明 的 选择 却 是 背叛 。 问 题 是 小 组 中 的 每 一 个 成 员 都 这 么 想 。 所 以 ,尽管 
以 合作 开始 ,但 是 以 背叛 结束 。 

公 地 的 悲剧 是 一 个 经 典 的 公共 物品 分 配 案例 (参阅 第 2 章 )。 对 于 现实 世界 所 关心 的 
自然 资源 ,从 石油 到 纯净 水 ,显而易见 可 以 类 推 。 当 遇 到 公共 资产 管理 时 如 果 合 作者 倾向 
于 背叛 ,我 们 怎么 能 为 子孙 后 代 保 护 地 球 生态 资本 ? 

还 好 ,并 非 所 有 和 希望 都 消失 了 。 实 验 发 现 了 存在 促使 参与 者 成 为 公共 物品 好 管家 的 
可 能 。 研 究 人 员 给 每 一 个 课题 小 组 40 欧元 ,让 他 们 玩 一 个 电脑 游戏 一 一 用 钱 来 维持 对 地 
球 气候 的 控制 。 参 与 者 被 告知 每 轮 游戏 都 必须 向 一 个 类 似 环 保 基 金 的 共享 池 提供 捐赠 ， 
多 少 不 限 。 如 果 在 10 轮 之 后 共享 池 中 的 钱币 不 少 于 120 欧元 ,那么 气候 就 是 安全 的 ,所 
有 的 玩家 将 获得 剩余 的 钱 ; 反之 ,如 果 池 中 的 钱币 少 于 120 欧元 ,那么 气候 就 会 垮 掉 ,所 
有 人 不 名 一 文 。 

结果 玩家 们 常常 因为 差 几 欧元 而 没 能 拯救 气候 0, 研 究 人 员 在 参与 者 的 行为 中 发 现 
了 能 够 激发 合作 的 迹象 。 研 究 人 员 发 现 , 当 玩 家 们 得 到 有 关 气 候 研 究 的 权威 信息 时 ,他 们 
表现 得 更 加 无 私 。 这 表明 人 们 需要 确信 一 点 , 即 遇 到 了 要 为 更 大 利益 而 做 出 牺牲 的 问题 。 
当面 临 需要 公开 自己 的 贡献 而 不 是 匿名 时 ,他 们 则 表现 得 更 为 慷慨 ,因为 这 关系 到 各 自 的 
声誉 。 

演化 模拟 表明 ,合作 本 质 上 是 不 稳定 的 。 合 作 繁荣 期 过 后 ,必然 会 过 渡 到 背叛 。 然 而 
利他 精神 似乎 总 是 重建 ,我 们 的 道德 罗盘 不 断 重新 调整 。 在 人 类 历史 的 跌宕 起 伏 中 在 政 
治 和 金融 系统 的 震荡 中 ,都 能 看 到 合作 与 背叛 的 循环 。 


8.4 合作 博弈 理论 


第 一 节 讨 论 了 几 个 经 典 案例 ,说明 博弈 游戏 中 参与 者 除了 直接 竞争 外 还 有 其 他 选择 ， 
有 时 只 有 通过 协调 合作 才能 获得 最 大 利益 ; 第 二 节 举 试 利用 效用 郴 数 对 博弈 行为 建立 统 
一 解释 ; 第 三 节 从 社会 学 .生物 学 和 人 类 学 等 角度 阐释 了 合作 的 演化 ,讨论 了 促成 合作 的 
几 种 机 制 ,并 说 明了 合作 在 自然 界 中 是 非常 普遍 的 现象 。 这 一 节 将 简要 介绍 合作 博弈 理 
论 ,包括 其 由 来 ,特征 .表示 方法 和 相关 的 重要 概念 。 


8.4.1 为 何 引 入 合作 博弈 


个 体 理性 并 不 是 也 不 应 该 是 人 类 经 济 行为 背后 的 唯一 逻辑 .由 前 两 节 的 分 析 可 知 现 
实 中 体现 了 集体 理性 的 集体 决策 行为 相当 普遍 。 

非 合 作 博 弈 理论 本 身 的 缺陷 也 促进 了 合作 博 穿 理 论 的 发 展 。 非 合作 博 府 分 析 经 常 遇 
到 无 帕 累 托 优 劣 关系 的 多 重 纳什 均衡 问题 。 例 如 ,两 人 分 100 元 现金 问题 。 如 果 两 人 要 


@ 这 一 点 并 不 难 理解 。 第 6 章 曾 说 过 ,即便 在 两 个 人 的 囚徒 困境 重复 博弈 中 ,合作 的 出 现 也 没有 我 们 想象 的 那 
么 乐观 。 
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求 的 金额 之 和 不 超过 100 元 , 则 每 人 都 能 获得 相应 的 现金 ,否则 两 人 什么 都 得 不 到 。 将 其 
作为 非 合 作 博 弈 研究 ,两 个 参与 者 的 策略 是 各 自 要 求 的 金额 0 之 xi 二 100, 当 双方 策略 组 
合 (z1,z2) 满 足 zl 二 zz 委 100 时 ,他 们 的 得 益 与 策略 出 价 相等 ,否则 得 益 为 0。 这 个 博弈 
有 多 重 纳什 均衡 , 即 只 要 (zl ,zz) 满 足 0 过 ri 委 100, 且 zl 十 zz? 一 100, 该 策略 组 合 就 是 一 个 
纳什 均衡 。 即 使 允许 参与 者 事先 协商 或 可 以 改变 策略 也 只 能 避免 出 现 zl 十 zz 所 100 的 
非 均衡 结果 ,但 是 并 不 能 确定 哪个 均衡 会 出 现 。 强 调 一 次 性 同时 选择 , 且 双 方 策略 之 和 
ZX1 十 X2 之 100 时 得 益 都 为 0, 聚 点 均衡 可 能 指示 的 结果 为 (50,50)。 但 如 果 不 强调 一 次 性 
同时 选择 , 聚 点 均衡 的 作用 也 不 强 。 因 此 除非 增加 设 定 , 对 讨价还价 过 程 进行 建 模 ,否则 
非 合 作 博 弈 理论 无 法 给 出 这 个 问题 的 最 终 答案 。 

非 合 作 博 弈 理论 之 所 以 无 法 解决 上 述 问 题 ,就 是 忽视 了 参与 者 之 间 可 能 的 合作 。 如 
果 考 虑 参与 者 可 能 采用 的 合作 ,就 能 通过 参与 者 之 间 的 协调 行为 来 解决 这 个 多 重 纳 什 均 
衡 选择 问题 。 类 似 地 ,还 有 很 多 博弈 问题 无 法 用 非 合 作 博 弈 理论 完美 地 解释 。 随 着 非 合 
作 博 弈 理论 暴露 出 越 来 越 多 的 局 限 性 ,合作 博弈 近年 来 越 来 越 受 到 人 们 的 重视 ,相关 理论 
也 迅速 发 展 起 来 。 
8.4.2 合作 博弈 的 特征 和 结构 


非 合作 博弈 与 合作 博弈 的 根本 区 别 , 是 前 者 不 允许 存在 有 约束 力 的 协议 ,而 后 者 则 允 
许 存在 。 采 用 “是否 允 许 存 在 有 约束 力 的 协议 "做 区 分 ,是 因为 如 果 不 允许 存在 这 种 协议 ， 
那么 除非 合作 行为 ( 指 参 与 者 采用 的 策略 ) 本 身 就 是 参与 者 的 最 优选 择 ,参与 者 没有 动机 
偏离 合作 ,否则 就 无 法 保证 参与 者 选择 合作 。 办 徒 困境 就 是 典型 的 例子 ,即使 合作 最 终 也 
有 利于 参与 者 自身 ,但 是 在 个 体 理性 条 件 下 ,合作 并 不 是 最 优选 择 。 而 当 允 许 使 用 有 约束 
力 的 协议 时 ,尽管 存在 偏离 合作 动机 ,参与 者 仍 有 可 能 通过 协调 ,协商 等 方式 达成 合作 协 

存在 有 约束 力 的 协议 ,说 明博 弈 问题 的 参与 者 之 间 既 存在 共同 利益 ,但 利益 又 不 完全 
一 致 。 如 果 参 与 者 之 间 的 利益 完全 对 立 或 完全 一 致 ,就 没有 协调 的 余地 或 完全 不 需要 协 
调 ,进而 就 可 以 利用 个 体 理性 决策 解决 问题 。 换 句 话说 ,这 种 情况 下 参与 者 之 间 也 就 不 需 
要 达成 协议 。 存 在 共同 利益 而 利益 不 完全 一 致 ,又 进一步 决定 了 利益 的 分 配 , 以 及 关于 利 
益 分 配 的 讨价还价 ,这 是 合作 博弈 的 共同 特征 。 事 实 上 ,合作 博弈 协议 的 内 容 除了 约定 行 
为 以 外 就 是 利益 分 配 ,达成 协议 的 前 提 是 通过 讨价还价 就 利益 分 割 达成 一 致意 见 。 不 管 
合作 博弈 问题 来 源 于 经 济 交易 、 政 治 谈判 ,也 不 管 参与 博 穿 的 人 数 多 少 , 本 质 上 都 是 关于 
利益 分 配 的 讨价还价 。 

例如 ,对 于 两 人 分 100 元 现金 的 问题 ,可 以 考虑 参与 者 利用 协议 协调 双方 行为 的 可 能 
性 。 但 签订 协议 的 前 提 是 双方 就 分 配方 案 达 成 共识 ,并 且 这 种 共识 的 达成 需要 通过 讨 价 
还 价 形成 。 因 此 两 人 分 100 元 现金 的 合作 博弈 是 关于 利益 分 配 的 讨价还价 问题 。 同 样 ， 
市 场 交 易 也 是 关于 利益 分 配 的 讨价还价 问题 。 假 设 两 人 就 某 个 物品 进行 交易 。 如 果 卖 方 
的 主观 价值 评价 是 50 元 ,买方 的 主观 价值 评价 是 70 元 ,两 人 交易 能 够 实现 总 共 70 一 50 
三 20 元 的 交易 利益 。 双 方 对 交易 价格 的 讨价还价 实际 上 就 是 对 20 元 交易 利益 分 配 的 讨 
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价 还 价 。 需 要 强调 的 是 ,即使 参与 者 的 数量 增加 ,也 不 会 改变 合作 博弈 的 本 质 特 征 。 例 
如 ,三 人 分 300 元 现金 问题 ? ,或 者 多 边贸 易 问题 等 ,本 质 上 也 都 是 关于 利益 分 配 的 讨 价 
还 价 。 

但 是 ,参与 者 的 数量 对 合作 博弈 确实 有 很 大 影响 。 当 合作 博弈 的 参与 者 只 有 两 个 人 
时 ,博弈 是 一 种 纯粹 的 讨价还价 。 这 种 情况 下 ,参与 者 的 选择 只 dda 
方案 合作 或 男 一 个 方案 进行 合作 。 而 当 参 与 者 多 于 两 人 时 ,情况 就 可 能 非常 复杂 一 一 
dtd tein et pre 
opr et rg eng eet ri ge ob en 
题 与 两 人 分 100 元 问题 只 差 一 个 参与 者 ,但 是 这 个 三 人 博弈 给 头脑 灵活 的 参与 者 提供 了 
We ee erin 
参与 者 1 和 参与 者 2 可 以 结 成 联盟 ,强行 通过 剥夺 参与 者 3 的 利益 并 对 他 们 有 利 的 方案 
(让 参与 者 3 得 到 非常 小 的 数 ,如 0) 。 参 与 者 3 也 可 以 通过 分 化 瓦解 参与 者 1 和 参与 者 2 
的 联盟 ,并 与 其 中 一 方形 成 新 的 联盟 加 以 对 抗 等 。 这 种 联盟 行为 将 对 博弈 结果 产生 很 大 
影响 ,使 得 三 人 及 以 上 合作 博弈 的 核心 问题 从 讨价还价 转变 为 联盟 问题 。 因 此 ,多 人 合作 
博弈 分 析 必须 包含 对 联盟 的 分 析 。 

多 人 合作 博弈 也 称 为 "联盟 博弈 ”, 而 纯粹 讨价还价 的 两 人 合作 博弈 则 称 为 "两 人 讨 价 
还 价 博 蛮 "。 两 人 讨价还价 博弈 和 多 人 联盟 博弈 构成 合作 博弈 理论 的 两 大 研究 对 象 。 下 
文 将 分 而 述 之 。 


8.4.3 两 人 讨价还价 


两 人 讨价还价 问题 是 合作 博弈 理论 所 讨论 的 基本 问题 ,也 是 博弈 论 最 早 研究 的 问题 
之 一 。 两 人 讨价还价 涉及 的 范围 很 广 , 包 括 交 易 双方 的 价格 谈判 合作 者 的 利润 奖金 分 
配 、 成 本 分 摊 , 以 及 资源 权益 分 割 等 。 它 们 的 实质 都 是 两 个 参与 者 之 间 对 特定 利益 的 分 割 
分 配 ,如 第 3 章 所 述 ,两 人 讨价还价 问题 也 可 以 用 非 合 作 博 弈 理论 进行 分 析 。 但 非 合 作 博 
弈 分 析 方法 与 合作 博弈 的 分 析 方法 是 不 同 的 , 它 是 在 对 讨价还价 过 程 建 模 基础 上 的 个 体 理 
性 决策 分 析 。 除 非特 别 说 明 , 下 文 对 两 人 讨价还价 问题 的 讨论 都 是 基于 合作 博弈 方法 的 。 

两 人 讨价还价 博 守 有 两 个 参与 者 ,用 参与 者 1 和 参与 者 2 表示 。 

两 人 讨价还价 问题 与 非 合作 博弈 的 第 一 个 明显 差异 是 参与 者 的 选择 内 容 。 非 合作 博 
弈 中 参与 者 选择 的 是 自身 策略 ,而 相互 作用 且 决 定 博弈 结果 的 也 是 彼此 的 策略 。 但 在 两 
人 讨价还价 中 ,由 于 允许 甚至 强调 通过 协议 协调 行为 .个 人 策略 并 不 能 直接 决定 结果 。 因 
此 重要 的 并 非 各 个 参与 者 的 个 人 策略 ,而 是 作为 协议 对 象 的 .同时 包含 双方 利益 的 分 配方 
案 ( 简 称 “分 配 ”)®。 以 两 人 分 100 元 为 例 , 单 个 参与 者 1 和 参与 者 2 想得到 多 少 元 ,如 


@ 三 人 分 300 元 问题 与 三 人 分 100 元 问题 在 本 质 上 没有 差别 。 但 是 前 者 的 数据 在 计算 与 讨论 上 相对 简单 ,后 
面 我 们 讨论 时 都 将 以 三 人 分 300 元 问题 为 例 。 

@ ”注意 分 配 本 身 意味 着 合作 博弈 中 的 利益 必须 容易 分 割 转让 ,如 现金 和 许多 容易 分 割 的 实物 等 。 当 利益 是 很 
难 分 割 的 项 目 ,选举 输赢 等 问题 时 ,分 配 会 遇 到 一 定 的 困难 ,必须 借助 某 种 旁 支 付 的 补偿 机 制 等 。 当 然 我 们 所 分 析 的 
大 多 数 合作 博弈 的 利益 都 是 容易 分 割 转让 的 。 
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50 元 、60 元 还 是 90 元 是 无 意义 的 ,有 意义 的 是 分 配 (40,60)、(50,50) 等 。 

分 配 受 两 个 基本 条 件 的 约束 。 首 先是 受 条 件 的 约束 ,如 在 两 人 分 100 元 问题 中 ,分 配 
必须 满足 双方 利益 之 和 不 超过 100 元 。 其 次 是 受 基本 理性 要 求 的 约束 ,如 在 两 人 分 100 
元 问题 中 ,双方 利益 必须 都 在 0 到 100 元 之 间 , 和 否则 对 双方 不 利 或 至 少 一 方 不 能 接受 。 同 
时 满足 上 述 两 个 要 求 的 分 配 称 为 博弈 的 “可 行 分 配 ”。 

两 人 讨价还价 博弈 的 分 配 一 般 用 z= (x1,xz) 表 示 ,. 其 中 x1 和 xz 分 别 代 表 两 个 参与 
者 的 利益 。 两 人 讨价还价 的 可 行 分 配 可 用 集合 F=={(x1 ,x2)10 过 zi 过 mm,X1 十 Xz 过 m}) 表 
示 , 其 中 放 1,2,m 是 最 大 可 分 配 利益 。 集 合 下 也 称 为 “可 行 分 配 集 ”"。 由 于 分 配 x 二 
(xz1,X2) 既 是 讨价还价 双方 的 选择 内 容 , 也 是 双方 得 到 的 利益 ,因此 分 配 和 可 行 分 配 集 在 
两 人 讨价还价 问题 分 析 中 具有 核心 地 位 。 

但 仅 有 分 配 概念 是 不 够 的 。 在 博弈 过 程 中 ,分 配 中 各 个 参与 者 的 利益 尚未 实现 ,仅仅 
是 期 望 利益 ,因此 需要 考虑 参与 者 的 风险 态度 。 而 且 , 讨 价 还 价 的 对 象 常常 不 是 现金 利 
益 , 而 是 物品 、 资 源 或 项 目 等 ,因此 还 需要 考虑 参与 者 的 主观 效用 评价 问题 。 例 如 ,如 果 讨 
价 还 价 的 对 象 是 一 堆 钢材 ,而 讨价还价 双方 一 个 是 建筑 师 , 另 一 个 是 废品 收购 者 ,那么 同 
样 的 分 配对 双方 的 效用 显然 是 不 同 的 。 一 个 果农 和 一 个 粮农 分 一 片 土地 ,如 果 种 粮食 和 
水 果 的 利润 分 别 是 每 亩 500 元 和 800 元 ,同样 的 分 配对 双方 的 价值 也 不 一 样 。 

因为 参与 者 的 风险 态度 和 对 分 配 的 主观 效用 评价 有 可 能 会 影响 双方 讨价还价 的 态度 
与 结果 (特别 是 当 双 方 态度 和 评价 存在 差异 时 ) ,所 以 两 人 讨价还价 问题 不 仅 需要 考虑 分 
配 , 也 需要 考虑 效用 配置 。 效 用 配置 常用 4 二 (wi,uz) 表 示 , 其 中 ui 是 参与 者 的 期 望 效 
用 ,是 分 配 集 S 到 实数 集 的 实 值 函 数 。 一 般 情况 下 .期 望 效用 就 是 参与 者 自身 利益 的 函 
数 , 即 wi 二 ui(z) 二 ui(zi)。 所 有 可 能 的 效用 配置 构成 “效用 配置 集 ”。 

两 人 讨价还价 合作 博弈 分 析 的 特点 ,决定 了 分 配 和 效用 配置 两 个 概念 都 非常 重要 。 
效用 代表 了 参与 者 的 偏好 和 内 在 要 求 ,效用 配置 会 从 主观 态度 方面 对 两 人 讨价还价 博弈 
的 过 程 和 结果 产生 影响 。 讨 价 还 价 合作 博弈 分 析 寻 找 的 合理 解 首先 要 符合 公平 性 ,而 公 
平 性 只 能 体现 在 客观 的 分 配 而 不 是 主观 的 效用 上 ,因此 分 配 在 讨价还价 中 也 非常 重要 。 
在 某 些 情况 下 ,分 配 与 效用 配置 是 一 致 的 。 当 讨价还价 的 对 象 是 现金 且 参 与 者 风险 中 性 
时 ,期 望 效用 就 等 于 利益 , 即 wi 二 wi(z) 二 wi(zi) 三 xi。 在 对 称 讨 价 还 价 问题 ?中 ,根据 分 
配 和 效用 配置 进行 分 析 的 结果 是 一 样 的 。 

两 人 讨价还价 问题 的 另 一 个 要 素 是 谈判 破裂 点 。 任 何 谈判 都 有 破裂 的 可 能 。 在 某 些 
情况 下 ,即使 谈判 破裂 ,参与 者 也 有 可 能 得 到 利益 。 例 如 , 甲 和 乙 两 人 进行 一 个 项 目的 合作 
谈判 。 假 设 该 项 目的 预期 利润 是 10 000 元 ,但 甲 不 搞 这 个 项 目 还 有 男 一 个 能 获 利 3 000 元 
的 项 目 , 而 乙 则 没有 其 他 获 利 机 会 。 那 么 如 果 甲 乙 间 的 谈判 破裂 , 甲 可 获得 3 000 元 ,而 
乙 的 收益 为 0。 这 种 谈判 破裂 时 双方 的 利益 称 为 “谈判 破裂 点 ” ,简称 " 破 裂 点 ”。 

破裂 点 通常 用 d= (di ,dz ) 表 示 , 其 中 di 是 参与 者 i 在 谈判 破裂 时 可 以 得 到 的 利益 。 


@ 对 称 讨价还价 问题 即 指 双方 在 立场 地 位 、 效 用 函数 、 破 裂 点 等 方面 都 没有 差异 ; 用 效用 配置 集 表 示 为 : 若 
Qsu2) EU,N 则 Cus) EU, 
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若 谈 判 破裂 时 两 参与 者 都 无 利益 , 则 谈判 破裂 点 为 (0,0) 。 谈 判 破裂 点 也 应 该 包含 在 可 行 
方案 集合 中 。 换 名 话说 ,“ 谈 判 破 裂 达 不 成 协议 "(agree to disagree) 也 是 讨价还价 双方 的 
可 行 选择 之 一 。 

谈判 破裂 点 对 讨价还价 双方 的 态度 和 结果 也 会 产生 影响 ,因为 理性 的 参与 者 不 可 能 
接受 低 于 破裂 点 利益 的 分 配 。 具 体 来 讲 ,效用 一 般 是 利益 的 增 函 数 ,因此 也 意味 着 参与 者 
不 可 能 接受 低 于 谈判 破裂 点 效用 的 分 配 。 更 进一步 ,一 个 讨价还价 博弈 要 有 意义 ,需要 至 
少 存在 一 个 分 配 ,能 给 两 个 参与 者 都 带 来 大 于 谈判 破裂 点 的 效用 。 否 则 就 不 可 能 存在 同 
时 引起 讨价还价 双方 兴趣 的 分 配 ,因而 无 法 实现 比 个 体 理性 博弈 更 好 的 结果 ,合作 博弈 也 

可 行 分 配 集 、 效 用 函数 以 及 谈判 破裂 点 是 一 个 两 人 讨价还价 问题 的 基本 要 素 ,是 抽象 
一 个 两 人 讨价还价 问题 必须 设 定 的 基本 方面 。 当 然 ,并 非 所 有 问题 都 千篇一律 。 具 体 的 
讨价还价 问题 可 能 还 有 一 些 条 件 和 特征 需要 详细 讨论 。 


Se » » 计 TY 可 
WwW 进 阶 阅 读 : 纳什 讨价还价 解 


在 分 析 两 人 讨价还价 问题 时 ,我 们 关注 的 是 : 什么 样 的 分 配 和 效用 配置 是 最 有 可 能 
被 双方 接受 与 采用 的 。 纳 什 提出 并 证 明了 ,两 人 讨价还价 问题 存在 同时 满足 个 体 理性 、 帕 
累 托 效率 、 对 称 性 、 线 性 变换 不 变性 和 独立 于 无 关 选 择 5 个 公理 的 唯一 解 , 即 纳什 讨 价 还 
价 解 。 方 便 起 见 , 用 B(F,d; ul,uz) 表 示 一 个 两 人 讨价还价 问题 ,其 中 下 是 可 行 分 配 集 ， 
地 为 破裂 点 ,xz 和 uz 则 是 两 个 参与 者 各 自 的 效用 函数 。 

(1) 个 体 理性 公理 : 设 B(F,d; xy'uz) 是 一 个 讨价还价 问题 ,如 果 分 配 (zy ,zy ) 是 
该 讨价还价 问题 的 解 ,那么 该 分 配 一 定 满足 : MaCZr ) 之 ui(d1) ,xz(zy ) 之 uz(d2)。 

(2) 帕 累 托 效率 公理 : 如 果 (zl,z2) 和 (zi1,z2) 都 是 某 个 讨价还价 问题 的 可 行 分 配 集 
合 中 的 点 , 且 m (zi)>rmaCzri),uz(zz) 二 xz2(z2) ,那么 (zi1,z2) 肯 定 不 会 是 该 讨价还价 博 
弈 的 解 。 

(3) 对 称 性 公理 : 如 果 B(F,d; ul'u2) 是 一 个 对 称 的 讨价还价 问题 , 则 作为 博弈 的 解 
(XY ,XZ ) 必 须 满足 Z7 二 XZ 。 

(4) 线性 变换 不 变性 公理 : 如 果 (zr ,zz ) 是 一 个 两 人 讨价还价 问题 的 解 ,那么 当 讨 
价 还 价 问题 中 的 效用 变换 为 ui 二 ai 十 biui; 时 ,(X 了 ,2 ) 仍 然 是 讨价还价 问题 的 解 。 

(5) 独立 于 无 关 选 择 公理 : 如 果 B(F.d; ulwu2) 和 B(F ,d ; uliwu2) 是 两 个 计价 还 
价 问题 , 且 满 足 FDF ,d 二 d ,那么 如 果 B(F,d; ul,u2) 的 合作 博弈 解 (zY ,zy )[ 对 应 
(wu? ,Uz )] 落 在 开 中, 则 (Zr ,XZ ) 一 定 也 是 BCF' ,di uilvuUsz) 的 解 。 

定理 8.1( 纳 什 讨 价 还 价 解 ) 对 于 两 人 讨价还价 问题 ,存在 满足 上 述 5 个 公理 的 唯 
一 讨价还价 解 , 它 是 使 纳什 积 [ui1 (Xz1) 一 wu1(di1)j][uz(zx2z) 一 uz (dz)] 达 到 最 大 的 (Xx1 ,Xx2)。 
或 者 说 ,纳什 讨价还价 解 是 如 下 问题 的 解 : 

max{[u (x1) — ww (di) [uz (zx2) — us (ds)]) 


1 :Ty 


(zlyzz) EF, (rzz) 二 (dldz) 
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下 面 以 两 人 分 100 元 现金 问题 说 明 纳什 解 的 应 用 。 

假设 参与 者 1 是 风险 中 性 的 , 即 1l 二 ul1(Xx1) 二 XxX1; 而 参与 者 2 是 风险 规避 的 , 即 x2 一 
Uz (xz2) 二 吉 ,其 中 5 二 1。 同 时 ,假设 这 个 讨价还价 问题 的 谈判 破裂 点 为 (0,0)。 

根据 问题 假设 ,这 个 讨价还价 问题 的 分 配 必 须 满足 约束 条 件 : x1 十 X72 三 100。 将 X11 二 
i 和 x2 二 wl 代入 , 则 效用 配置 必须 满足 : ul 十 ul 过 100。 

用 纳什 解法 分 析 这 个 问题 ,就 是 求解 下 列 纳什 积 的 约束 优化 问题 


max ulu2 
ul us 


ui +ul® < 100 
根据 约束 条 件 可 得 uz 二 (100 一 wu1)*, 代 入 纳什 积 转 化 为 单 变 量 最 优化 问题 : 


maxui(100— wu1)s 


一 阶 条 件 为 


(100=u? +urb(100 = ) (=)=0 
两 边 乘 (100 一 uy )! 必得 
100 一 好 —urb=0 


0 二 005 oo05 
可 解 得 w 二 这 一 5。 进一步 可 得 芝 一 1 他 一 (村 。 


从 这 个 结果 可 以 看 出 ,讨价还价 双方 风险 偏好 的 差异 对 讨价还价 的 结果 有 明显 影响 。 
双方 所 得 分 配 的 差异 取决 于 反映 风险 偏好 的 系数 5b。b 越 小 ,风险 规避 程度 越 严重 ,所 得 
的 分 配 就 越 少 ,所 得 效用 越 少 。 这 也 是 经 济 活动 中 “性 格 决定 命运 ”的 理论 演绎 ,是 一 个 很 
有 启示 作用 的 结论 。 


8.4.4 联盟 博弈 


联盟 博弈 就 是 三 个 或 三 个 以 上 参与 者 的 多 人 合作 博弈 问题 。 前 面 已 经 对 三 人 分 300 
元 问题 进行 过 简要 介绍 。 如 前 所 述 , 多 人 合作 博弈 中 存在 参与 者 之 间 联 盟 的 可 能 性 ,因此 
多 人 合作 博弈 与 两 人 讨价还价 明显 不 同 。 多 人 合作 博弈 分 析 必 须 包 含 对 联盟 的 分 析 , 因 
此 多 人 合作 博弈 也 称 为 “联盟 博弈 ”或 “联盟 型 博弈 ”。 

设 联盟 博 灾 有? 个 参与 者 ,可 以 直接 用 数字 1,2,….n 表示 ,它们 构成 集合 N 一 11， 
2,…,n)。 讨 论 合作 博 穿 ,总 是 假设 个 参与 者 之 间 存 在 合作 的 可 能 性 (也 就 是 说 ,通过 合 
作 可 以 得 到 更 多 的 利益 )。 博 弈 中 的 联盟 就 是 N 的 子 集 SCN。NN 的 所 有 子 集 构成 的 集 
合 记 为 P(N)。 因 为 N 有 nn 个 元 素 ,因此 N 共有 2" 个 子 集 。 其 中 ,N 表示 所 有 参与 者 联 
合 组 成 联盟 ,形成 的 联盟 称 为 大 联盟 ; 单元 素 子 集 { 习 表示 参与 者 i 不 与 任何 人 联盟 ,一 个 
人 “单干 ”, 形 成 了 规模 最 小 的 联盟 ; 空 集 名 指 联盟 不 包含 任意 一 个 参与 者 ,本 身 不 具有 实 
际 意义 。 在 所 有 子 集中 , 非 空 子 集 有 2" 一 1 个 ,能 构成 有 意义 联盟 且 至 少 包含 两 个 元 素 的 
子 集 有 2 一 2 一 1 个 。 很 显然 ,联盟 博弈 的 参与 者 数 越 多 ,可 能 的 联盟 就 越 多 ,博弈 也 就 越 
复杂 。 


联盟 博弈 的 分 配 概念 与 两 人 讨价还价 博弈 是 相似 的 。 一 般 用 向 量 x 一 (z1，…'zn)ER" 
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表示 联盟 博弈 的 分 配 ,其 中 zi 为 参与 者 i 的 期 望 效用 。 联 盟 博 弈 的 分 配 必须 符合 博弈 问 
题 的 基本 假设 ,以 及 参与 者 的 风险 和 效用 偏好 。 此 外 联盟 博弈 的 分 配 必须 满足 每 个 参 
与 者 的 得 益 都 不 少 于 其 不 参加 任何 联盟 的 得 益 , 和 否则 相关 参与 者 就 不 会 参与 联盟 博弈 。 
满足 这 些 要 求 的 分 配 全 体 构成 联盟 博弈 的 “可 行 分 配 集 ”。 

8.4.2 节 曾 经 提 到 ,部 分 参与 者 之 间 的 联盟 和 分 化 瓦解 增加 了 对 联盟 问题 的 分 析 难 
度 ,因而 讨论 联盟 博弈 问题 首先 需要 对 不 同 联盟 进行 比较 讨论 。 那 么 怎样 才能 使 得 不 同 
联盟 之 间 具 有 可 比 性 呢 ? 

为 解决 这 个 问题 ,我 们 需要 建立 一 种 方便 比较 的 参照 系 。 换 句 话 说 ,需要 将 所 有 可 能 
的 联盟 经 过 变换 (或 计算 ) 对 应 到 有 序 的 实数 集中 。 要 求 这 个 实数 是 唯一 的 ,并 且 不 能 与 
成 员 的 集体 理性 冲突 。 所 谓 不 能 与 成 员 的 集体 理性 冲突 ,是 指 联盟 被 视 为 整体 时 所 采取 
的 行动 应 该 是 最 优 反 应 。 那 么 ,这 个 实数 应 该 是 什么 呢 ?” 基 于 博弈 问题 的 基本 假设 ,我 们 
知道 参与 者 直接 关心 的 只 有 效用 ,因此 可 以 选择 联盟 内 所 有 成 员 的 效用 总 和 作为 比较 依 
据 。 假 设 联盟 为 5S, 显然 联盟 的 效用 总 和 是 唯一 的 。 进 而 ,效用 总 和 须 满足 集体 理性 。 也 
就 是 说 ,这 个 效用 总 和 不 能 是 随便 一 组 联盟 内 成 员 和 非 联 盟 成 员 的 行动 所 构成 的 策略 组 
合 的 期 望 效 用 的 计算 结果 ,而 是 联盟 S 的 内 部 成 员 效 用 总 和 的 最 优 值 。 进 一 步 思 考 , 当 
所 有 非 S 成 员 联 合 起 来 对 抗 S 时 ,会 尽 可 能 使 S 的 效用 总 和 “最低 ”。 而 联盟 S 内 的 成 员 
会 如 何 行动 呢 ? 当然 是 在 所 有 内 部 成 员 联 合 的 情况 下 选择 策略 ,寻找 所 有 ”最 低 ? 中 的 ”最 
高 "。 换 言 之 ,S 每 采取 一 个 行动 , 非 S 成 员 都 能 做 出 行动 ,使 得 S 的 效用 总 和 "最低 ” 而 
S 则 在 所 有 可 能 行动 中 寻求 能 使 自己 状况 最 好 的 。 回 到 最 初 的 问题 ,我 们 找到 了 一 种 对 
应 关系 (函数 ): 对 于 任何 一 个 联盟 S ,都 有 一 个 值 与 之 对 应 ,这 个 值 就 是 联盟 内 成 员 效 用 
总 和 的 “最 差 中 的 最 好 ”。 此 处 的 "最 差 " 对 应 于 非 联盟 成 员 的 策略 选择 ,而 “最 好 ” 则 对 应 
于 自己 的 策略 选择 。 这 种 对 应 关系 ,我 们 将 其 称 为 特征 函数 ; 而 满足 “最 差 中 的 最 好 ”的 
值 称 为 联盟 的 保证 水 平 , 记 为 v(S)。 

以 三 人 分 300 元 问题 为 例 : 显然 v(2) 二 0; 由 8. 4.2 节 的 讨论 可 知 ,如 果 参 与 者 1 
选择 不 与 任何 人 联盟 ,那么 参与 者 2 和 参与 者 3 就 能 强行 通过 剥夺 参与 者 1 的 利益 的 分 
配方 案 , 即 w({1)) 王 0, 同 理 可 知 v({2))= 二 0,v({3)) 二 0; 如 果 参 与 者 1 和 参与 者 2 联盟 ， 
无 论 参 与 者 3 提出 怎样 的 分 配方 案 ,他 们 都 能 强行 通过 剥夺 参与 者 3 的 利益 的 分 配方 案 ， 
即 v({1,2)) 二 300, 同 理 v({2,3)) 二 300,v({1,3)) 二 300; 如 果 三 个 人 形成 大 联盟 ,显然 效 
用 总 和 为 300 元 , 即 w({1,2,3)) 王 300。 

再 看 一 个 简单 的 例子 : 手套 游戏 。 

人 群 N= 二 {1,2,…,n}) 划 分 为 两 个 不 相交 的 子 集 LL 和 R。L 中 的 成 员 每 人 都 拥有 一 只 
完全 相同 的 左手 套 ,R 中 的 成 员 每 人 拥有 一 只 可 与 世 中 成 员 的 左手 套 匹配 的 右手 套 。 作 
为 商品 , 单 只 手套 一 文 不 值 ,而 左右 两 只 手套 匹配 后 得 到 的 一 副手 套 值 100 元 。 

我 们 可 以 很 容易 将 其 视 为 合作 博弈 进行 分 析 。 对 于 每 一 个 联盟 SE2N,S 中 可 能 同 
时 包含 工 中 的 成 员 和 R 中 的 成 员 。 能 够 匹配 成 对 的 手套 数 只 能 取 |SNLI(S 中 持 有 左手 


@ 。 即 参与 者 是 理性 的 。 
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套 的 人 数 ) 和 |SNRI(S 中 持 有 右手 套 的 人 数 ) 中 的 最 小 值 。 因 此 ,联盟 S 的 特征 函数 可 
以 定义 为 
vsS) = 100X mnt|l SNLLI ISNMRIE YSE2 
特征 函数 是 衡量 联盟 价值 的 重要 基础 ,对 形成 何 种 联盟 和 博弈 结果 有 决定 作用 ,在 联 
盟 博 弈 中 占有 重要 地 位 。 联 盟 博 弈 有 时 也 称 为 “特征 函数 型 博弈 "。 联 盟 博弈 也 表示 为 
BC(N,v) ,其 中 vv 就 是 其 特征 函数 。 
利用 特征 函数 还 可 以 对 联盟 博弈 进行 分 类 。 满 足 v(N) 二 2 的 联盟 博弈 称 


为 “本 质 博弈 ”, 而 满足 "CN) 一 a )) 的 联盟 博弈 称 为 “ 非 本 质 博弈 "*。 若 一 个 联盟 博 


弈 的 w(CS) 只 能 取 0 和 1， 且 单 人 联盟 的 特征 画 数值 为 0， 而 大 联盟 特征 函数 值 为 1, 则 称 为 
“简单 博 蛮 ”。 在 简单 博弈 中 ,特征 函数 值 为 1 的 联盟 称 为 “胜利 联盟 ”, 特 征 函数 值 为 0 的 
联盟 称 为 “失败 联盟 ”。 


oO » | > ~ 全 
WW 进 阶 阅 读 : 特征 函数 与 特征 函数 值 


定义 8.1( 特 征 函 数 ) 对 于 nn 人 联盟 博弈 中 的 联盟 SE P(N)。 不管 联 盟 外 成 员 如 
何 行为 ,联盟 成 员 通 过 协调 行为 可 保证 实现 的 最 大 联盟 总 得 益 , 称 为 联盟 的 “保证 水 平 ”， 
记 为 vu(S)。 一 个 联盟 博弈 所 有 可 能 联盟 的 保证 水 平 ,构成 P(N) 一 R 的 一 个 实 值 函 数 ， 
该 函数 称 为 这 个 联盟 的 “特征 函数 ”。 

根据 特征 函数 的 定义 ,一 般 联 盟 博 弈 特征 函数 值 的 计算 公式 为 

v(S) = max min Duilz, y) 


ZzEzs ?ErNsiES 
式 中 : zs 为 S 中 成 员 全 部 联合 时 混合 策略 的 全 体 ; ZN/S 为 N/SQ 中 成 员 全 部 联合 时 混 
合 策略 的 全 体 ; ui(zyy) 为 参与 者 对 应 策略 组 合 (z,y) 的 期 望 得 益 。 现 实 中 常常 通过 对 
博弈 的 直接 分 析 得 到 特征 函数 值 。 


一 个 博弈 模型 ,可 以 对 结果 进行 怎样 的 期 望 与 规定 ?博弈 论 中 的 大 部 分 内 容 总 
是 以 某 种 方式 引 向 这 个 问题 。 在 合作 博弈 中 ,“ 解 "就 是 关于 利益 的 稳定 分 配 。 合 作 博 弈 
解 概 念 有 很 多 ,可 以 将 其 归 为 两 大 类 : 占 优 方法 和 估 值 方法 。 
1. 占 优 方法 
占 优 方法 以 * 占 优 ?为 主要 准则 ,体现 了 稳定 和 联盟 的 信息 。 在 非 合 作 博 弈 中 我 们 曾 
经 利用 占 优 分 析 讨 论 参 与 者 的 策略 选择 问题 。 由 于 联盟 博弈 最 终 还 是 参与 者 的 策略 选择 
问题 ,因此 可 以 模仿 非 合 作 博 弈 的 占 优 分 析 。 例 如 ,在 三 人 分 300 元 现金 问题 中 ,如 果 参 
与 者 1 和 参与 者 2 形成 联盟 ,那么 分 配 (150,150,0) 显 然 优 于 分 配 (100,100,100)。 相 对 
地 ,如 果 参 与 者 2 和 参与 者 3 形成 联盟 ,那么 分 配 (0,170,130) 显 然 优 于 分 配 (150,150， 
0)。 这 种 分 配 之 间 的 “ 占 优 ” 关 系 在 联盟 博弈 中 非常 普遍 ,而 且 它 直接 影响 联盟 的 稳定 或 
瓦解 。 在 合作 博弈 中 ,我 们 将 这 种 分 配 之 间 的 “ 优 劣 ”关系 定义 为 “ 优 超 ”。 下 面 我 们 给 出 


Q@ N/S 表 示 除 了 联盟 S 中 的 成 员 , 剩 下 的 所 有 参与 者 。 
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它 的 定义 。 

定义 8.2(x 关 于 S 优 超 y) 对 于 联盟 博弈 B(N,v) 的 分 配 xy, 以 及 联盟 SCN, 如 
果 吉之 yis ViES 都 成 立 , 且 》)zi 过 wv(S), 则 称 “z 关 于 S 优 超 y”, 记 为 >y。 

i€S 

定义 8.3(x 优 超 y) 对 于 联盟 博弈 B(N,v) 的 分 配 Xz、y, 如 果 导 SCN, 使 得 >y, 
则 称 “z 优 超 y”, 记 为 工 一 y。 

当 z 关 于 S 优 超 y 时 ,可 以 看 到 S 中 的 成 员 能 够 通过 自己 的 努力 改善 他 们 的 支付 ， 
即 S 可 以 在 zx 的 基础 上 得 到 “改进 "。 有 时 ,将 S 称 为 “阻塞 联盟 ”, 也 就 是 说 ,S 可 以 “ 阻 
止 ?或 “反对 ”分 配 z。 

利用 优 超 来 分 析 联 盟 博 弈 ,我 们 很 容易 联想 到 : 不 会 被 任何 分 配 优 超 的 分 配 具 有 稳 
定性 ,是 否 可 以 将 其 作为 联盟 博弈 的 * 解 " 呢 ? 答案 是 肯定 的 。 

我 们 来 看 一 个 简单 的 例子 : 同样 是 三 人 分 300 元 问题 ,但 是 将 规则 改 为 必须 全 部 同 
意 。 此 时 联盟 博弈 的 任意 一 个 满足 ”0 委 ri 委 300,zl 十 zz 十 zs 一 3002 的 分 配 (zlyzzyz3s) 
都 具有 稳定 性 。 因 为 任何 非 三 人 联盟 特征 函数 v(S) 二 0, 根据 优 超 的 定义 ,不 存在 任何 能 
够 优 超 (zl ,zz zs) 的 分 配 ; 而 对 于 三 人 联盟 {1,2,3) ,因为 zl 十 zz 十 zs 三 300, 所 以 不 可 
能 存在 同时 满足 二 zl\ yz 二 zz 、 ys 二 zs 和 yi 十 yz 十 x3 三 300 的 分 配 (y1,yz,y3), 因 此 
也 不 存在 任何 能 够 优 超 (xi,xz ,zs) 的 分 配 。 所 以 ,上 述 集 合 中 的 分 配 都 具有 稳定 性 , 任 
意 一 个 都 可 以 作为 该 联盟 博弈 的 " 解 ”。 

在 联盟 博弈 中 ,我 们 将 上 述 不 能 被 优 超 的 分 配 组 成 的 集合 称 为 “ 核 ”。 利 用 优 超 的 概 
念 ,可 以 得 到 核 的 定义 。 

定义 8.4( 核 ) 对 于 nn 人 联盟 博弈 B(N,v) ,分 配 集中 不 被 任何 分 配 优 超 的 分 配 的 全 
体 , 称 为 该 博弈 的 “ 核 ”, 记 为 CCN,u) 。 

把 核 作 为 联盟 博弈 的 解 概 念 ,最 符合 直观 ,也 最 容易 理解 。 但 它 同时 也 存在 问题 。 因 
为 联盟 博弈 的 核 常常 是 空 集 , 即 使 核 非 空 ,其 中 包含 的 解 分 配 也 不 一 定 唯 一 。 当 解 分 配 不 
唯一 时 ,就 无 法 准确 预测 联盟 博弈 的 最 终结 果 , 解 概念 的 作用 就 会 受到 很 大 限制 。 上 述 改 
变 规则 后 的 三 人 分 300 元 问题 恰恰 反映 了 这 个 问题 。 而 且 更 多 情况 下 ,联盟 博弈 的 核 是 
空 集 , 无 法 对 博弈 结果 的 预测 提供 任何 帮助 。 

以 三 人 分 300 元 现金 为 例 (规则 仍 为 “少数 服从 多 数 ”) 。 该 博弈 的 可 行 分 配 集 为 

F= {((zlyzzyzs) | X11 x2 二 zx3 = 300,71 之 0,x2 之 0,x3 宇 0} 
图 8-7 给 出 了 一 般 情况 下 三 人 联盟 的 核 的 示意 图 , 它 是 三 维 中 的 一 个 平面 蚀 去 不 合理 区 
域 所 剩 的 阴影 部 分 。 

当然 , 它 也 可 能 为 空 集 。 来 看 一 个 特殊 情况 ,车 wv({1})==0,v({2})= 二 0,v({3)) 二 0， 
v({1,2}) 二 300,v({2,3}) 二 300,v({1,3}) 二 300,v({1,2,3)) 二 300。 我 们 将 指出 ,任何 
满足 "zl 二 0,zz 二 0,zs 二 0" 的 分 配 (Czl,zz ,zs) 都 不 在 核 内 。 因 为 在 这 种 情况 下 ,任何 两 
个 参与 者 的 总 收入 都 将 少 于 300 元 ,如 x1 十 zz 二 300。 这 时 参与 者 1 和 参与 者 2 可 以 形 
成 联盟 从 而 取得 支配 权 , 使 得 在 他 们 之 间 完 全 地 分 配 300 元 。 同 时 ,恰好 有 两 个 人 得 0 的 
分 配 也 不 在 核 内 ,因为 这 两 个 人 可 以 形成 联盟 ,从 而 共享 300 元 。 现 在 我 们 讨论 恰好 只 
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(0.0.300) 


nu{1}) =>U({2) 


xrtxs>u({1,3}) 
Xrtxytxs=300 


Ttx>0({1,2)) 


x>U({3)) 


(0,300,0) 
mix 二 U({2,3}) 


图 8-7 三 人 联盟 的 核 的 示意 图 (阴影 部 分 ) 


一 个 人 得 0 的 分 配 , 不 妨 设 zl = 二 0, 分 配方 案 为 (zx1,xz ,x3) 二 (0,s,300 一 5s), 其 中 ;二 0。 
为 了 改善 自己 的 处 境 , 参 与 者 1 可 以 提出 一 个 新 方案 (300 一 > 一 和,* 十 上 0) ,其 中 ! 盖 0, 且 
十 上 4<<300。 这 个 新 方案 可 以 使 参与 者 2 脱离 与 参与 者 3 的 联盟 ,而 与 参与 者 1 形成 新 联 
盟 。 因 此 该 博弈 的 核 内 不 可 能 存在 恰好 有 一 个 人 得 0 的 分 配 。 显 然 , 所 有 人 都 得 0 的 分 
配 也 不 可 能 在 核 中 。 综 上 所 述 ,该 博弈 的 核 为 空 集 。 

WW 进 阶 阅读 : 核 与 瓦解 

联盟 博弈 的 “ 核 ” 也 可 以 定义 在 "瓦解 "概念 的 基础 上 。 先 介绍 瓦解 的 定义 。 

定义 8.5( 瓦 解 ) 设 x 二 (x1,…,zn) 是 联盟 博弈 B(N,v) 的 一 个 可 行 分 配 。 如 果 联 
盟 S 使 得 v(S) 二 2 二 x(S)，, 也 就 是 说 联盟 的 特征 函数 值 (保证 水 平 ) 高 于 上 述 分 配 

村 
带 给 联盟 成 员 得 益 的 总 和 ,就 说 “联盟 S 瓦解 分 配 z+”。 

定义 8.6( 核 ) 设 B(N,v) 是 一 个 联盟 博弈 ,在 B(N,v) 的 可 行 分 配 集中 ,所 有 不 会 
被 任何 联盟 所 瓦解 的 分 配 的 集合 , 称 为 这 个 联盟 博弈 的 “ 核 ”。 

不 难看 出 ,定义 在 瓦解 概念 上 的 核 与 定义 在 优 超 概念 上 的 核实 际 上 是 相同 的 。 事 实 
上 , 优 超 和 瓦解 之 间 存 在 对 应 关系 。 例 如 ,根据 瓦解 的 定义 不 难 判 断 ,三 人 分 300 元 博弈 
中 两 个 优 超 关 系 中 的 联盟 {1,2) 和 {2,3) ,就 是 分 别 瓦解 分 配 (100,100,100) 和 (150,150， 
0) 的 联盟 。 

当 经 济 问题 表示 为 x 人 合作 博弈 形式 时 ,它们 常常 有 非 空 的 核 ,并 且 核 一 般 也 是 令 人 
满意 的 解 概念 。 然 而 ,有 许多 博弈 的 核 是 空 集 。 这 一 困难 不 但 出 现在 对 政治 与 选举 进行 
模型 化 的 过 程 中 ,也 出 现在 产业 组 织 模型 中 。 在 这 些 情况 下 稳定 集 " 概 念 在 分 析 联 盟 的 
形成 竞争 与 权力 的 分 配 时 常常 优 于 其 他 的 解 概念 。 

稳定 集 是 冯 。 诺 依 曼 和 摩根 斯 坦 首先 提出 的 。 这 一 概念 也 是 基于 优 超 的 占 优 分 析 ， 
与 核 概念 有 着 密切 的 联系 。 从 定义 上 看 , 核 就 是 不 可 被 占 优 的 分 配 集 , 即 核 中 的 分 配 既 不 
会 被 核 内 的 其 他 分 配 占 优 ,也 不 会 被 核 外 的 分 配 占 优 。 假设 w 是 联盟 博弈 的 一 个 分 配 
集 。 如 果 w 中 的 任何 一 个 分 配 都 不 会 被 w 中 的 其 他 分 配 优 超 ( 内 部 稳定 性 ), 并 且 每 个 w 
之 外 的 分 配 都 被 w 中 的 某 个 分 配 优 超 (外 部 稳定 性 ) ,那么 w 就 是 "稳定 集 ”。 
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以 三 人 分 300 元 问题 为 例 (规则 为 "所 有 人 都 必须 同意 ”) : 

此 博弈 的 稳定 集 为 w=({(zl,zz,zs)|0 委 垃 委 300,zl 十 zz 十 zs 三 300)。 先 讨论 内 部 
稳定 性 。 设 (zi,zz,zs) 和 (yy ,ys) 是 w 中 的 两 个 分 配 , 即 0<xi,yi 寺 300,X1 十 X2 十 x3 二 
300,y1 十 yz 十 y3 二 300。 假 设 Cy1,y2,y3) 优 超 (x1 ,zz ,zs), 即 二 zlyy 二 zz ,ys 二 z3， 则 
WY1 十 y2 十 y3 之 XT1 十 Xx2 十 TX3 二 300, 与 y1 十 yz 十 y3 二 300 矛盾 。 所 以 假设 不 成 立 , 即 w 满足 
内 部 稳定 性 。 再 讨论 外 部 稳定 性 。 假 设 (z1,z2,z3)(0 过 zi; 过 300,z1 十 zz 十 z3 二 300) 是 久 
外 的 任 一 分 配 。 令 300 一 zi 十 zz 十 x3 二 4(1 之 0) ,显然 ,w 中 的 分 配 (z1 十 1/3,z2z 十 1/3,z3 十 
1/3) 优 超 (z1 ,xz2 ,zs), 即 w 满足 外 部 稳定 性 。 综 上 所 述 ,分 配 集 w 是 该 博弈 的 稳定 集 。 

定义 8.7( 稳 定 集 ) 对 于 nn 人 联盟 博弈 B(N,v), 若 分 配 集 w 满足 : 

(1) 内 部 稳定 性 , 即 不 存在 zyyEow' 使 得 xy。 

(2) 外 部 稳定 性 , 即 V XKFw,yEw, 使 得 y+,， 则 分 配 集 ww 称 为 这 个 联盟 博弈 的 一 
个 “稳定 集 ”。 

一 般 来 说 ,稳定 集 是 包含 核 的 。 稳 定 集 也 是 联盟 博弈 重要 的 解 概念 之 一 。 但 稳定 集 
作为 联盟 博弈 的 解 概 念 同样 有 问题 ,因为 稳定 集 同样 常常 是 空 集 ,而 非 空 时 又 常常 不 
唯一 。 

上 述 我 们 介绍 的 核 和 稳定 集 都 属于 “ 占 优 ” 方 法 ,可 以 比较 直观 地 比较 分 配 之 间 的 优 
劣 关 系 。 但 是 ,它们 存在 “致命 缺陷 ”一 一 有 时 不 存在 ,有 时 存在 但 不 唯一 。 当 核 或 稳定 集 
不 存在 时 ,自然 无 法 将 其 作为 合作 博弈 的 解 ; 当 核 或 稳定 集中 包含 多 个 解 , 甚 至 是 无 限 个 
解 时 ,又 无 法 决定 选择 哪 一 个 ,因为 每 个 解 都 有 它 的 合理 之 处 。 

是 否 存在 一 个 解 概念 , 既 合 理 又 无 争议 呢 ? 接 下 来 我 们 将 介绍 第 二 种 方法 , 即 * 估 值 
法 中 具有 重要 意义 的 “夏普 利 值 ”。 

2. 估 值 方法 


| 语 故 事 


约克 和 汤姆 结对 旅游 。 当 他 们 准备 吃 午餐 时 ,恰好 有 一 个 饥饿 的 路 人 经 过 ,约克 和 汤 
姆 便 邀 请 他 一 起 吃 午 餐 。 约 克 带 了 3 块 饼 ,汤姆 带 了 5 块 饼 。 他 们 将 8 块 饼 均 分 为 3 份 ， 
每 人 一 份 。 吃 完 饭 后 ,路 人 赠 给 了 他 们 8 个 金币 以 表示 感谢 。 之 后 ,路 人 继续 赶路 。 

约克 和 汤姆 为 这 8 个 金币 的 分 配 产生 了 争执 。 汤 姆 说 :“ 我 带 了 5 块 饼 ,理应 我 得 5 
个 金币 ,你 得 3 个 金币 。” 约 克 不 同意 :“ 了 既然 我 们 在 一 起 吃 这 8 块 饼 ,理应 平分 这 8 个 金 
币 ”约克 坚持 认为 每 人 各 得 4 块 金 币 。 为 此 ,约克 找到 公正 的 夏普 利 进行 裁决 。 

夏普 利 对 约克 说 :“ 孩 子 ,汤姆 给 你 3 个 金币 ,因为 你 们 是 朋友 ,你 应 该 接受 它 ; 如 果 
你 要 公正 的 话 ,那么 我 告诉 你 ,公正 的 分 法 是 ,你 应 当 得 到 1 个 金币 ,而 你 的 朋友 汤姆 应 当 
得 到 7 个 金币 ”约克 很 不 理解 。 

夏普 利 说 :“ 是 这 样 的 ,孩子 。 你 们 3 人 吃 了 8 块 饼 , 其 中 ,你 带 了 3 块 饼 ,汤姆 带 了 5 
块 饼 ,一 共 是 8 块 饼 。 你 吃 了 其 中 的 1/3, 即 8/3 块 ,路 人 吃 了 你 带 的 饼 中 的 3 一 8/3 二 1/3 
块 ; 你 的 朋友 汤姆 也 吃 了 8/3 块 ,路 人 吃 了 他 带 的 饼 中 的 5 一 8/3 二 7/3 块 。 这 样 ,路 人 所 
吃 的 8/3 块 饼 中 ,有 你 的 1/3, 汤 姆 的 7/3。 因 此 路 人 所 吃 的 饼 中 ,属于 汤姆 的 是 属于 你 的 
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7 倍 。 所 以 ,对 于 这 8 个 金币 ,公平 的 分 法 是 : 你 得 1 个 金币 ,汤姆 得 7 个 金币 。 你 看 有 没 
有 道理 ?” 

约克 听 了 夏普 利 的 分 析 认 为 有 道理 ,愉快 地 接受 了 1 个 金币 ,而 让 汤姆 得 到 了 7 个 
金币 。 


在 这 个 故事 中 ,我 们 看 到 ,夏普 利 所 提出 的 对 金币 的 “公平 的 ”分 法 ,遵循 的 原则 是 : 
每 个 人 的 所 得 与 他 做 出 的 贡献 相等 。 这 就 是 夏普 利 值 的 “核心 内 涵 ”。 

夏普 利 值 的 计算 依据 是 : 每 个 参与 者 对 联盟 的 贡献 。 夏 普 利 值 赋予 每 个 联盟 博弈 一 
个 独一无二 的 “合理 产 出 ”, 用 以 考虑 并 加 以 受 协 所 有 相互 冲突 的 主张 。 夏普 利 值 回答 了 
这 样 一 个 问题 : 参与 者 怎样 才能 “合理 地 ”分 享 联盟 博弈 中 的 剩余 ? 在 联盟 博弈 中 ,每 个 
参与 者 都 以 一 定 概率 选择 “单干 "或 者 与 其 他 参与 者 联盟 。 当 参与 者 i 加 入 某 一 个 联盟 
时 ,会 对 原 联盟 的 特征 函数 值 (保证 水 平 ) 产 生 影 响 , 使 原 联盟 的 特征 函数 值 由 v1 变 为 v2。 
而 wz 一 v1 就 是 参与 者 i 对 原 联盟 的 贡献 。 将 参与 者 i 对 该 联盟 的 贡献 与 他 加 入 该 联盟 的 
概率 相 乘 ,就 得 到 了 参与 者 i 参加 该 联盟 的 期 望 效 用 。 青 将 参与 者 i 所 有 可 能 参加 的 联 
盟 的 期 望 效 用 累加 ,就 得 到 了 参与 者 i 参加 联盟 博弈 的 期 望 效用 。 这 个 期 望 效用 就 称 为 
参与 者 i 的 夏普 利 值 。 

与 市 场 经 济 中 按 边际 生产 力 分 配 的 原则 一 样 ,在 联盟 博弈 中 按照 各 个 参与 者 的 贡献 
进行 分 配 ,也 比较 公平 和 容易 被 接受 。 夏 普 利 值 反映 的 正 是 各 个 参与 者 在 联盟 博弈 中 的 
贡献 和 价值 ,因此 夏普 利 值 是 联盟 博弈 中 进行 公平 分 配 的 有 效 方法 。 

夏普 利 值 是 联盟 博弈 的 最 重要 的 解 概 念 之 一 ,在 资源 管理 ,税务 分 担 、 公 用 事业 定价 
以 及 政治 生活 等 方面 都 有 重要 作用 。 例 如 , 班 扎 夫 所 提出 的 政治 选举 中 的 “ 班 扎 夫 权 力 指 
数 ”, 就 是 利用 夏普 利 值 的 思想 构造 的 。 

作为 夏普 利 值 基础 的 三 个 公理 : 

(1) 对 称 性 公理 : 每 个 参与 者 获得 的 分 配 与 他 在 集合 N 二 {1,2,…,n) 中 的 排列 位 置 
无 关 。 

(2) 有 效 性 公理 : 四 车 参与 者 i 对 他 所 参加 的 任 一 合作 都 无 贡献 , 则 给 他 的 分 配 应 为 
0; 加 全 体 参 与 者 的 夏普 利 值 之 和 分 割 完 相应 联盟 的 价值 ,也 即 特 征 函 数值 。 

(3) 加 法 公理 : 两 个 独立 的 博 弃 合 并 时 ,合并 博弈 的 夏普 利 值 是 两 个 独立 博弈 的 夏 
普 利 值 之 和 。 

夏普 利 证 明了 同时 符合 上 述 三 个 公理 ,描述 联盟 博弈 B(N.v) 各 个 参与 者 价值 的 唯 
一 指标 是 向 量 (Pi ,… gn) ,其 中 gi 二 六 四 一 他 1 一 D![,(S) 一 wkS\(ij)],gs 公式 中 


SEN nl 
nn 是 联盟 博 讲 的 总 人 数 ,二 | S | 为 联盟 S 的 规模 , 即 S 中 包含 的 参与 者 数量 。 向 量 (pl1，…， 
qn) 称 为 联盟 博弈 B(N,u) 的 “夏普 利 值 ” ,pi 是 参与 者 i 的 夏普 利 值 。 

从 概率 的 角度 来 理解 夏普 利 值 的 思想 : 假设 参与 者 按照 随机 顺序 形成 联盟 ,每 种 顺 
序 发 生 的 概率 都 相等 , 均 为 1/n!1。 参 与 者 i 与 其 前 面 的 (| S| 一 1) 人 形成 联盟 S, 参 与 者 i 
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对 该 联盟 的 边际 贡献 为 u(S) 一 u(S\{i})。 由 于 S\{ 让 与 N\S 的 参与 者 排序 共有 (k 一 1) 1 


(n 一 上 D1 种 ,因此 ,每 种 排序 出 现 的 概率 就 是 中 一人 1 一 1 。 可见 ,参与 者 i 在 所 有 联 


盟 S 中 的 边际 贡献 的 期 望 得 益 之 和 恰好 就 是 夏普 利 值 。 
2 扩展 阅读 : 罗 伊 德 . 夏普 利 


罗 伊 德 。 夏 普 利 , 出 生 于 1923 年 6 月 2 日 ,美国 著名 数学 家 和 经 济 学 家 ,在 美国 加 州 
大 学 洛杉矶 分 校 数学 和 经 济 系 担 任教 授 。 在 20 世纪 40 年 代 的 纽曼 和 摩根 斯 坦 之 后 , 夏 
普 利 被 认为 是 博弈 论 领域 最 出 色 的 学 者 。 他 在 数理 经 济 学 和 博弈 论 领域 有 卓越 贡献 , 代 
表 理 论 有 随机 对 策 理 论 、Bondareva-Shapley 规则 、Shapley-Shubik 权力 指数 、Gale- 
Shapley 运算 法 则 、 潜 在 博弈 论 概念 .Aumann-Shapley 定价 理论 ,Harsanyi-Shapley 解决 
理论 ,Shapley-Folkman 定理 等 。2012 年 , 罗 伊 德 。 夏普 利和 阿尔 文 。 罗 斯 (Alvin Roth) 
因 对 稳定 配置 理论 和 市 场 设计 实践 的 车 越 贡 献 而 荣 府 诺 贝 尔 经 济 学 奖 。 

谈 起 夏普 利 , 许 多 中 国学 者 会 对 他 有 一 种 天 然 的 亲切 感 ,因为 他 曾经 在 中 国 的 土地 上 
与 中 国 军 民 并 肩 抗击 过 日 本 侵略 者 。1943 年 ,作为 哈佛 大 学 数学 系 的 一 名 本 科 生 ,他 应 
征 入 伍 成 为 一 名 空军 中 士 , 并 很 快 奔赴 中 国 成 都 战区 。 当 时 ,夏普 利 展现 出 了 卓越 的 数学 
才能 ,并 因 破 解 气象 密码 获得 铜 星 奖章 。 战 争 结束 后 ,夏普 利 回 到 哈佛 大 学 继续 念书 。 他 
在 1948 年 取得 数学 学 士 学 位 ,随后 进入 普林斯顿 大 学 数学 系 , 一 路 念 到 博士 毕业 (他 的 博 
士 导师 也 是 纳什 的 导师 )。 此 后 ,他 长 期 在 美国 著名 的 “战略 思想 库 ” 兰 德 公司 工 作 ,1981 
年 后 , 则 一 直 担 任 美 国 加 州 大 学 洛杉矶 分 校 数学 和 经 济 系 教授 。 

2002 年 8 月 ,夏普 利 因 为 参加 青岛 大 学 承办 的 “2002 国际 数学 家 大 会 “对 策 论 及 其 应 
用 ?卫星 会 议 ” 再 次 来 到 中 国 。 青 岛 之 行 , 当 再 次 讲述 起 他 与 中 国 相隔 近 60 年 的 那 段 济源 
时 , 老 先生 依然 非常 激动 ! 


8.5 合作 博弈 应 用 举例 * 


8.4 节 介 绍 了 合作 博弈 的 由 来 和 特征 ,将 合作 博弈 分 为 两 大 类 一 一 两 人 讨价还价 问 
题 和 联盟 博弈 ,并 分 别 介绍 了 两 类 博弈 的 表示 方法 和 相关 概念 ,相信 大 家 对 合作 博弈 已 经 
有 了 初步 印象 。 本 节 将 以 排列 博弈 和 稳定 匹配 为 例 进行 讲解 。 这 些 例 子 真实 有 趣 又 具有 
代表 性 ,可 以 让 我 们 了 解 合作 博弈 的 应 用 之 广泛 ,同时 为 我 们 今后 处 理 类 似 的 问题 提供 了 
模板 。 


8.5.1 排列 博弈 


排列 博弈 最 早 是 由 Tijs 等 作为 一 种 成 本 博弈 提出 的 。 首 先 考 虑 下 面 这 样 一 个 机 器 
排列 问题 : 

(1) 一 共 及 个 参与 者 ,每 个 参与 者 i 拥有 一 台 机 器 Mi, 且 有 一 个 任务 J; 待 完成 。 

(2) 任何 一 个 参与 者 的 机 器 都 可 以 完成 所 有 参与 者 的 任务 ,但 是 每 台 机 器 至 多 只 能 
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完成 一 个 任务 。 

(3) 允许 形成 联盟 , 且 效 用 可 在 参与 者 之 间 交 换 转 移 。 

(4) 如 果 参 与 者 之 间 不 进行 合作 , 则 每 个 参与 者 的 任务 在 自己 的 机 器 上 完成 。 

(5) 在 机 器 Mi 上 完成 任务 Ji 所 需要 付出 的 成 本 是 好 ,1<i,j<n。 

此 联盟 博弈 待 求解 的 问题 是 : 如 何 给 每 台 机 器 安排 任务 ,才能 使 完成 所 有 任务 的 总 
成 本 最 低 ， 合作 人 全 

考虑 一 个 三 人 排列 问题 。 设 在 每 台 机 器 上 完成 各 项 任务 的 成 本 依次 为 ell 一 2,&21 一 
1 ,Asl 人 4,A22 一 6,A3s2 一 8,Rl3 一 3.A23 一 10,Ass 一 9。 

显然 ,c( 名 ) 二 0。 如 果 三 人 不 形成 联盟 (三 人 不 合作 ), 则 每 人 所 需 成 本 依次 为 : 
c((1)) 二 2,c({2)) 二 6,c({3)) 二 9。 如 果 参 与 者 1 和 2 形成 联盟 , 则 所 需 的 最 低 成 本 为 ， 
c({1,2)) 王 min{2 十 6,1 十 4} 一 5; 同 理 参与 者 1 和 3 形成 联盟 与 参与 者 2 和 3 形成 联盟 
所 需 的 最 低 成 本 分 别 : c({1,3))= 二 10,c({2,3)) 二 15。 如 果 参 与 者 1.2 和 3 形成 联盟 , 则 
所 需 的 最 低 成 本 为 : c((1,2,3)} 王 min{2 十 6 十 9,2 十 8 十 10,1 十 4 十 9,1 十 8 十 3,7 十 4 十 10， 
7 十 6 十 3} 一 12。 

如 果 三 个 参与 者 都 愿意 合作 的 话 ,那么 成 本 最 小 的 结果 是 : 任务 1 在 机 器 3 上 完成 、 
任务 2 在 机 器 1 上 完成 ,任务 3 在 机 器 2 上 完成 ,总 成 本 为 12。 利 用 夏普 利 值 公式 计算 每 
个 人 应 该 分 摊 的 成 本 ,可 得 

c(1) 一 一 1/3， c(2) = 25/6, c(3) = 49/6 

即 该 排列 博弈 的 总 最 低 成 本 为 12。 其 中 ,参与 者 2 应 支付 25/6 ,参与 者 3 应 支付 
49/6 ,剩余 的 1/3 应 该 归 参 与 者 1 所 有 。 

为 了 更 普遍 地 理解 排列 问题 的 本 质 , 来 看 排列 博弈 的 数学 表示 。 对 于 博弈 v, 设 参与 
者 集合 N= 二 {1,2,…,n)。 每 个 参与 者 i EN 认为 菜 个 排列 xETIIN 的 价值 是 kxci)。 任 意 
联盟 SCN 都 可 以 变更 排列 x 以 使 只 有 本 联盟 的 成 员 被 排列 , 即 x(i) 二 i(Vi€ NN\S)。 
联盟 S 的 价值 v(S) 定 义 为 联盟 S 所 有 成 员 的 价值 之 和 在 所 有 可 行 的 排列 上 的 最 大 值 。 
正式 地 说 , 设 Is 表示 满足 x(i) 二 i(YV iE€ N\S) 的 所 有 排列 xE IIN 的 集合 , 则 

v(S) = max > AD 


xzEDsieS 


这 就 是 排列 博弈。 
8.5.2 稳定 匹配 


匹配 博弈 是 一 类 研究 和 应 用 都 非常 广泛 的 博弈 ,最 早 开始 于 盖 尔 和 夏普 利 1962 年 简 
短 而 有 重要 启发 意义 的 一 篇 论文 ,研究 大 学 招生 和 婚姻 匹配 问题 。 

匹配 问题 最 初 是 由 婚姻 问题 开始 研究 的 ,但 是 相关 的 经 济 应 用 也 有 很 多 。 例 如 ,经 理 
寻找 雇员 .教授 寻找 研究 助理 ,机 长 寻找 副手 等 ,都 是 类 似 的 问题 。 他 们 的 共同 点 是 一 
发 出 匹配 邀约 , 另 一 方 决定 是 否 接受 。 
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但 是 ,在 一 对 一 匹配 问题 中 ,最 典型 的 仍然 是 婚姻 匹配 问题 。 因 此 ,我 们 将 以 婚姻 匹 
配 问 题 为 例 ,寻找 博弈 中 的 稳定 匹配 。 

假设 存在 一 个 婚姻 介绍 所 ,很 多 未 婚 男 女 把 自己 的 信息 和 偏好 提供 给 婚姻 介绍 所 , 然 
后 由 婚姻 介绍 所 根据 参与 者 偏好 来 进行 匹配 。 我 们 以 两 个 有 限 集合 M= (mi,m2，…， 
mz} 和 WW 二 {wi ,wz ,… ,wn}) 分 别 表示 所 有 的 未 婚 男 士 和 女士 的 集合 。 每 个 男士 (女士 ) 都 
对 其 潜在 的 可 能 配偶 拥有 严格 的 偏好 , 即 他 在 不 同 选择 之 间 总 是 可 以 做 出 比较 和 判断 ,或 
者 认为 女士 (男士 )A 优 于 B, 或 者 认为 B 优 于 A。 并 且 偏 好 是 可 传递 的 , 即 如 果 他 认为 A 
优 于 B, 而 B 优 于 C, 那 么 A 也 优 于 C。 

假设 PCm) 表 示 某 男士 在 集合 WU{m) 上 的 偏好 。 例 如 

Pl(m) = wi ,tw2 ,tw4 sw3 
这 表明 他 最 希望 与 wi 匹配 ,其 次 是 wz ,再 次 是 rw, 最 后 是 ws 。 女 士 的 偏好 也 可 以 类 似 
地 给 出 。 在 匹配 博弈 中 ,我 们 假设 参与 者 对 于 不 同 匹配 的 偏好 仅仅 取决 于 自己 的 偏好 ,而 
不 考虑 其 他 参与 者 的 偏好 ,也 就 是 说 假设 参与 者 是 自 利 的 。 

一 个 “匹配 "是 指 : 给 出 每 位 男士 和 每 位 女士 的 一 男 一 女 的 “一 对 一 "组合 。 在 这 里 有 
一 个 非常 关键 的 假定 : 婚姻 匹配 是 自愿 的 。 也 就 是 说 ,婚姻 介绍 所 给 出 了 一 个 匹配 列表 ， 
如 果 某 个 参与 者 不 同意 按照 列表 中 的 结果 ,可 以 自行 与 男 一 个 集合 中 的 参与 者 沟通 并 配 
对 。 这 个 假设 直接 决定 了 婚姻 匹配 问题 中 的 核心 问题 ; 匹配 的 稳定 性 问题 。 当 一 个 特定 
的 匹配 被 提出 ,如 果 某 一 个 “一 对 一 ”组合 中 的 男士 (女士) 与 男 一 对 组 合 中 的 女士 (男士 ) 
更 愿意 结合 ,那么 该 匹配 就 不 稳定 。 如 果 在 一 个 匹配 中 没有 出 现任 何 一 位 男士 和 一 位 女 
士 产 生 类 似 于 上 述 反 对 的 情形 , 则 称 这 个 匹配 是 稳定 的 。 将 要 讨论 的 核心 问题 是 : 是 否 
存在 一 个 稳定 的 匹配 ,以 及 如 何 达 到 稳定 的 匹配 ? 

显然 ,最 好 的 配对 方案 是 : 每 个 人 的 另 一 半 正 好 都 是 自己 的 "第 一 选择 "”。 然 而 这 种 
完美 的 方案 在 绝 大 多 数 情况 下 都 不 可 能 实现 。 例 如 ,mi 最 喜欢 的 是 zwl ,而 wi 的 最 爱 不 
是 mi ,这 两 个 人 的 最 佳 选择 就 不 可 能 被 同时 满足 。 如 果 几 位 男士 同时 最 喜欢 同一 女士 ， 
这 几 位 男士 的 首选 也 不 会 同时 得 到 满足 。 当 这 种 最 为 理想 的 配对 方案 无 法 实现 时 ,怎样 
的 配对 方案 才能 令 人 满意 呢 ? 

先 看 一 种 较为 简单 的 情况 。 假 设 只 有 2 男 2 女 。 图 8-8 所 示 的 就 是 2 男 2 女 的 一 种 
情形 ,每 个 男 的 都 更 喜欢 wi ,但 wi 更 喜欢 m2 ,wz 更 喜欢 m1 。 若 按 (n1 zol), (1m2 ,twz) 
进行 搭配 , 则 ms 和 el 都 更 喜欢 对 方 一 些 , 这 样 的 婚姻 搭配 就 是 不 稳定 的 。 但 车 换 一 种 
搭配 方案 (图 8-9) ,这 样 的 搭配 就 是 稳定 的 了 。 


MW wa — wi(m, m2) mi(Wwi, wa) wim ma) 
maA(Wi, wa) 一 一 一 wami, m2) mwi, wa) 2 wa(m1, m2) 
图 8-8 一 个 不 稳定 的 婚姻 搭配 图 8-9 一 个 稳定 的 婚姻 搭配 


很 多 人 可 能 会 立即 想到 一 种 寻找 稳定 婚姻 搭配 的 策略 : 不 断 修补 当前 搭配 方案 。 如 
果 两 个 人 互相 都 觉得 对 方 比 自己 当前 的 伴侣 更 好 ,就 让 这 两 个 人 成 为 一 对 , 剩 下 被 甩 的 那 
两 个 人 组 成 一 对 。 如 果 还 有 想 要 私奔 的 男女 对 ,就 继续 按照 他 们 的 愿望 对 换 情侣 ,直到 最 
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终 消除 所 有 的 不 稳定 组 合 。 
不 难看 出 ,应 用 这 种 “修补 策略 ”所 得 到 的 最 终结 果 一 定 满足 稳定 性 ,但 这 种 策略 的 问 
题 在 于 , 它 不 一 定 存在 “最 终结 果 ”。 事 实 上 ,按照 上 述 方法 反复 调整 搭配 方案 ,最 终 可 能 


会 陷入 死 循 环 o mI(W3, Wa Was WI) -WICH1, 114, m3, 112) 
假如 有 4 男 4 女 ,相互 偏 好 如 图 8-10 所 示 mW3, Wa, Was WI) Wa 1 113, m4) 
Dk g ma(Wi, W3 Was Wa) Ws), tm13, 1114, 1112) 
遗憾 的 是 ,利用 之 前 的 分 析 方 法 ,我 们 会 得 到 下 面 mGws, ws wa wy) wa(ma, m1, ma m3) 
的 死 循 环 ,如 图 8-11 所 示 。 图 8-10 4 男 4 女 相互 偏好 
Cm, wi) (mi, w») (Cm, wa) 
(ma, Wa) (mi wa) (m2, wi) (Mi wa) (m2, Wi) 
(m3, ws) (m3, w3) (m3, w3) 
(m3, Wa) (m4, wa) (ms, wa) 
Cn, wi) 
(ma wa) (m2, Wa) (m2. Wa) 
(m3, W3) 
(Cd w2) 


图 8-11 “修补 策略 ”导致 的 死 循 环 


可 见 应 用 “修补 策略 "寻找 稳定 匹配 方案 不 仅 过 程 十 分 烦琐 ,甚至 难以 回答 “稳定 匹配 
是 否 存 在 "这 一 基本 问题 。 因 此 ,我 们 需要 寻找 一 种 新 的 方法 , 既 能 回答 是 否 存 在 稳定 匹 
配 又 能 准确 地 达成 匹配 。 这 就 是 我 们 接 下 来 要 介绍 的 “Gale-Shapley 算法 ”。 

1962 年 ,美国 数学 家 盖 尔 和 夏普 利 提出 了 一 种 寻找 稳定 婚姻 的 策略 。 无 论 男女 各 有 
多 少 人 ,也 不 管 他 们 的 偏好 如 何 , 应 用 这 种 策略 总 能 得 到 一 个 稳定 的 搭配 。 换 言 之 ,他 们 
证 明了 稳定 的 婚姻 匹配 总 是 存在 的 。 

在 这 种 策略 中 ,男士 将 一 轮 一 轮 地 去 追求 他 中 意 的 女士 ,女士 可 以 选择 接受 或 者 拒绝 
她 的 追求 者 。 此 即 Gale-Shapley 算法 ,过 程 如 下 。 

Gale-Shapley 算法 : 

初始 状态 : 有 对 等 数量 的 男士 和 女士 相互 匹配 。 每 个 男士 心目 中 都 有 一 个 排序 ,是 
关于 所 有 女士 的 喜欢 程度 的 ; 女士 心目 中 也 有 一 个 排序 ,是 关于 所 有 男士 的 接受 程度 的 。 

第 一 轮 。 每 个 男士 都 选择 自己 心目 中 排 在 首位 的 女士 ,并 向 她 表白 。 此 时 ,一 个 女士 
可 能 面 对 的 情况 有 三 种 : 没有 人 跟 她 表白 ,只 有 一 个 人 跟 她 表白 和 不 止 一 人 向 她 表白 。 
在 第 一 种 情况 下 ,这 个 女士 什么 都 不 用 做 ,只 需 继 续 等 待 ; 在 第 二 种 情况 下 ,不 拒绝 ,暂时 
先 谈 着 ; 在 第 三 种 情况 下 ,从 所 有 追求 者 中 选择 自己 最 中 意 的 那 一 位 , 先 谈 着 ,并 拒绝 所 
有 其 他 追求 者 。 

第 二 轮 。 第 一 轮 结束 后 ,有 些 男士 已 经 有 女 朋 友 了 ,有 些 男士 仍然 是 单身 。 在 第 二 轮 
追求 女士 行动 中 ,每 个 单身 男士 都 从 所 有 还 没 拒绝 过 他 的 女士 中 选 出 自己 最 中 意 的 那 一 
个 ,并 向 她 表白 ,不 管 她 现在 是 否 是 单身 。 和 第 一 轮 一 样 ,女士 们 需要 从 表白 者 中 选择 最 
中 意 的 一 位 ,拒绝 其 他 追求 者 。 注 意 , 如 果 这 个 女士 已 经 有 男 朋 友 了 , 当 她 遇 到 了 更 好 的 
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追求 者 时 ,她 必须 拒绝 现任 ,投向 新 的 追求 者 的 怀抱 。 这 样 ,一 些 单身 男士 将 会 得 到 女友 ， 
也 有 一 些 将 成 为 前 任 。 

Si 在 以 后 的 每 一 轮 中 ,被 拒绝 的 单身 男士 继续 追求 心目 中 的 下 一 个 女士 ,女士 则 进 
行 比较 并 决定 是 否 拒 绝 。 

结束 。 这 样 一 轮 一 轮 地 进行 下 去 ,直到 某 个 时 候 所 有 人 都 不 再 单身 ,下 一 轮 将 不 会 有 
任何 新 的 表白 发 生 , 整 个 过 程 自动 结束 。 

这 个 策略 为 什么 一 定 可 以 得 到 一 个 稳定 的 匹配 方案 呢 ? 下 面 将 给 予 证 明 。 

(1) 随 着 轮 数 的 增加 ,总 有 一 个 时 候 所 有 人 都 能 配对 。 由 于 在 每 一 轮 中 ,至 少 会 有 一 
个 男士 向 某 个 女士 告白 ,因此 总 的 告白 次 数 将 随 着 轮 数 的 增加 而 增加 。 倘 若 整 个 流程 一 
直 没 有 因 所 有 人 都 配 上 对 了 而 结束 ,最 终 必然 会 出 现 某 个 男士 追 遍 了 所 有 女士 的 情况 。 
而 一 个 女士 只 要 被 人 追 过 一 次 ,以 后 就 不 可 能 再 单身 了 。 既 然 所 有 女士 都 被 这 个 男士 追 
求 过 ,就 说 明 所 有 女士 现在 都 不 是 单身 ,也 就 是 说 此 时 所 有 人 都 已 配对 。 

(2) 随 着 轮 数 的 增加 ,男士 追求 的 对 象 越 来 越 糟 ,而 女士 的 男友 则 可 能 变 得 越 来 越 
好 。 假 设 ma 和 wi 各 自 有 各 自 的 对 象 ,但 比 起 现在 的 对 象 ,m1 更 喜欢 rw。 那么 ,ma 之 
前 肯定 已 经 向 ww 表白 过 。 既 然 wi 最 后 没有 和 mm 在 一 起 ,说 明 wi 拒绝 了 mm, 也 就 是 
说 她 有 了 比 m1 更 好 的 男士 。 这 就 证 明了 ,两 个 人 虽然 不 是 一 对 ,但 都 觉得 对 方 比 自己 现 
在 的 伴侣 好 ,这 样 的 情况 绝 不 可 能 发 生 。 

再 次 讨论 前 述 的 4 男 4 女 问题 ,虽然 “修补 策略 ?是 行 不 通 的 ,但 是 应 用 Gale-Shapley 
算法 则 可 以 快速 地 得 到 该 匹配 问题 的 均衡 。 有 具体 过 程 如 图 8-12 所 示 , 其 中 “ X "表示 被 


拒绝 。 
mi(Wa Wa Wa Wl) Wi(mimamapm2) 
第 一 轮 maws Wa Ww) wal mm 
下 ma(Wi wa Wa wy) walmym3.mam2) 


ma(Wa Wa Wa Ww) ) Wa(mam1 M403) 


mI(Wy Wy. 


WW ) Wim ma mmm) 
Ma(Ws, es wa mgm my) 

第 二 轮 ms(Wiws Wawa) pm) 
Wa(ma, 1 ,714,113) 


Ma(Was Wa Ws) 


Wi(miymamym2) 
wom mym3m4) 
wa(mym3,m4712) 
WN ) 一 一 一 一 TCDvmivmym3) 


第 三 轮 


图 8-12 ”应 用 上 述 策略 ,三 轮 之 后 将 得 出 稳定 的 婚姻 搭配 
我 们 把 用 来 解决 某 种 问题 的 一 个 策略 ,或 者 一 个 方案 ,或 者 一 系列 操作 规则 , 称 为 “ 算 


法 ”。 上 述 用 来 寻找 稳定 婚姻 的 策略 就 叫 作 "Gale-Shapley 算法 ”, 或 称 为 “延迟 接受 
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定理 8.2 假设 /是 一 个 婚姻 匹配 问题 的 任 一 分 配 , 则 存在 有 限 个 匹配 组 成 的 序列 
Ja yp2 At， 使 得 Mt 是 稳定 匹配 ,而 且 对 于 i 一 1,2,…,(R 一 1), 都 存在 (maivroi) 来 阻止 
/而 且 jui+1l 是 在 jii 的 基础 上 满足 了 (mi,twi) 的 要 求 所 得 到 的 。 

上 述 定 理 说 明 : 对 任意 一 个 婚姻 匹配 问题 ,从 任 一 匹配 出 发 ,通过 参与 者 的 独立 决 
策 , 最 终 总 是 可 以 收敛 到 稳定 匹配 。 


WW 进 阶 阅读 : Gale-Shapley 算法 的 应 用 和 整 端 


自从 盖 尔 和 夏普 利 提 出 稳定 匹配 理论 后 ,该 理论 被 广泛 且 富 有 成 效 地 应 用 于 双边 
的 环境 中 。 例 如 ,大 学 的 录取 、 课 程 分 配 、 住 房 分 配 、 婚 姻 的 匹配 、 住 院 大 夫 就 职 . 肾脏 
交换 等 ,尤其 在 最 新 的 ,大 型 的 .具有 重要 社会 性 的 资源 分 配 问题 中 得 到 日 益 广 泛 的 

以 美国 的 “全 国 住院 医师 配对 项 目 ” 为 例 , 该 项 目 采取 的 配对 的 基本 流程 是 : 各 医院 
从 尚未 拒绝 从 这 一 职位 的 医学 院 学 生 中 选 出 最 佳人 选 并 发 送 聘用 通知 , 当 学 生 收 到 来 自 
各 医院 的 聘用 通知 后 ,系统 会 根据 他 所 填写 的 意愿 表 自 动 将 其 分 配 到 意愿 最 高 的 职位 ,并 
拒绝 掉 其 他 的 职位 。 如 此 反复 ,直到 每 个 学 生 都 分 配 到 了 工作 。 实 际 上 ,在 Gale-Shapley 
算法 提出 之 前 ,美国 就 已 经 开始 用 这 种 办 法 给 医学 院 的 学 生 安 排 工 作 了 ,只 是 当时 人 们 并 
不 知道 这 样 的 流程 可 以 保证 工作 分 配 的 稳定 性 ,单纯 地 赁 直觉 认为 这 是 很 合理 的 。 直 到 
10 年 之 后 ,Gale 和 Shapley 才 系 统 地 研究 了 这 个 流程 ,提出 了 稳定 婚姻 问题 ,并 证 明了 这 
个 算法 的 正确 性 。 

但 这 个 算法 还 有 一 些 局 限 。 例 如 , 它 无 法 处 理 2n 个 人 (不 分 男女 ) 的 稳定 搭配 问题 。 
一 个 简单 的 应 用 场景 便 是 宿舍 分 配 问 题 ; 假设 每 个 宿舍 住 两 个 人 ,已 知 2n 个 学 生 中 每 一 
个 学 生 对 其 余 2n 一 1 个 学 生 的 偏好 评价 ,如 何 寻 找 一 个 稳定 的 宿舍 分 配 ?” 此 时 ,Gale- 
Shapley 算法 就 不 再 有 用 武之 地 了 。 事 实 上 , 宿舍 分 配 问题 中 可 能 根本 就 不 存在 稳定 
匹配 。 

为 了 简化 问题 ,考虑 四 个 参与 者 a,b,c,d, 其 偏好 为 


Pl(a) = b,csd 
P(b) 一 cayd 
P(ec) =a,b,d 


d 和 任意 一 人 成 为 室友 都 可 以 。 

由 偏好 可 见 , 大 家 都 不 愿意 和 d 一 起 住 ,而 且 其 他 三 个 人 中 的 每 个 人 都 有 另外 某 个 
人 最 喜欢 和 他 一 起 住 。 显 然 ,这 个 宿舍 分 配 问 题 不 可 能 存在 稳定 的 匹配 。 因 为 任何 一 个 
匹配 都 必须 有 人 与 d 作 伴 ,那么 一 定 会 有 人 来 阻止 这 样 的 匹配 。 


Gale 和 Shapley 在 稳定 匹配 问题 上 的 卓越 工作 激发 了 人 们 对 于 该 问题 的 各 种 变 体 
的 广泛 调查 和 研究 ,包括 在 实践 中 不 断 出 现 的 各 种 困难 和 细节 ,其 中 两 个 最 重要 的 变 
体 是 : 非 严 偏好 的 多 对 一 匹配 和 非 严 偏好 的 多 对 多 匹配 。 有 兴趣 的 读者 可 参阅 更 多 的 
资料 。 
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Gale 和 Shapley 的 研究 成 果 还 可 广泛 用 于 解决 中 国 现实 社会 存在 的 问题 。 例 如 , 目 
前 中 国 发 展 的 地 区 差别 ,城乡 差别 .工农 差别 和 行业 差别 等 ,每 个 问题 都 与 资源 配置 、 市 场 
设计 密切 相关 。 运 用 Gale 和 Shapley 的 成 果 可 以 设计 合理 的 市 场 机 制 来 分 配 资 源 , 以 达 
到 最 优 的 分 配 ,从 而 减少 差异 ,减少 矛盾 ,促进 社会 发 展 。 


Eg 


性 


参考 文献 


Ackerloff G. The market for lemons: Quality uncertainty and the market mechanism[J]. Quarterly 
journal of economics, 1970, 84(3): 488-500. 

Banks J S, Weintraub E R. Toward a history of game theory[J]. Journal of Interdisciplinary 
History, 1992, 25(4): 647. 

Barnard G A. The foundations of statistics [M]. New York: Wiley, 1954. 

Bo P D, Fréchette G R. The evolution of cooperation in infinitely repeated games: Experimental 
evidence[J]. American Economic Review, 2011, 101(1): 411-429. 

Boyd R, Richerson P J. Culture and the evolution of human cooperation [J ]. Philosophical 
Transactions of the Royal Society B: Biological Sciences, 2009, 364(1533) : 3281-3288. 

Fehr E, Schmidt K M. A Theory of Fairness，Competition，and Cooperation [J ]. Quarterly 
Journal of Economics, 1999, 114(3): 817-868. 

Friedman A. Computation of saddle points for differential games of pursuit and evasion [J]. 
Archive for Rational Mechanics &. Analysis, 1971, 40(2) : 79-119. 

Friedman J] W. A Noncooperative View of Oligopoly[J]. International Economic Review,1971,12 
(1): 106-122. 

Fudenberg D, Tirole J. Perfect Bayesian equilibrium and sequential equilibrium[ JJ]. Journal of 
Economic Theory, 1991, 53(53) : 236-260. 

Ge Z, Hu Q, Xia Y. Firms’ R&D Cooperation Behavior in a Supply Chain[J]. Production &. 
Operations Management, 2014, 23(4): 599-609. 

Ge Z, Hu Q. Collaboration in R&D activities: Firm-specific decisions[J]. European Journal of 
Operational Research, 2008, 185(2): 864-883. 

Ge Z, Zhang Z K, LiiL, et al，How altruism works: An evolutionary model of supply networks[J]. 
Physica A, 2012, 391(3) : 647-655. 

Henrich J，Mecelreath R, Barr A, et al. Costly punishment across human societies[J]. Chinese 
Science & Technology Translators Journal, 2008, 312(5781): 1767-1770. 

Kreps D M, Wilson R. Reputation and imperfect information [J ]. Levines Working Paper 
Archive, 1999, 27(2): 253-279. 

Kiibler D, Miiller W, Normann H T. Job-market signaling and screening: An experimental 
comparison[J]. Games & Economic Behavior, 2008, 64(1): 219-236. 

Lewis D K. Convention: A Philosophic Study[J]. Philosophical Books, 1969, 11(2).: 14-15. 
Luce R D, Raiffa H. Games and decisions: introduction and critical surveyL M]. New York: 
Wiley, 1957. 

Malhotra D. Decision Making Using Game Theory: An Introduction for Managers, by Anthony 
KellyLJ]. Academy of Management Review, 2005, 30(1): 193-194. 

Niou E, Ordeshook P C. Strategy and Politics: An Introduction to Game Theory [M]. New 
York: Routledge, 2015. 

Ordeshook P C, Palfrey T R. Agendas, strategic voting, and signaling with incomplete 


321 


博弈 论 入 门 


information[ J ]. American Journal of Political Science, 1988, 32(2) : 441-466. 

Powell R. Nuclear brinkmanship， limited war, and military power [J ]. International 
Organization，2015， 69(3) : 589-626. 

Paik A, Woodley V. Symbols and investments as signals: Courtship behaviors in adolescent 
sexual relationships[J]. Rationality & Society, 2012, 24(1) : 3-36. 

Ramsey F P. Truth and Probability[J]. History of Economic Thought Chapters, 1926, 57(3): 
211-238. 

Schelling T C. The strategy of conflict [M]. MA Cambridge: Harvard University Press, 1960. 
Thielscher M. A general game description language for incomplete information games[C]// 
Twenty-Fourth AAAI Conference on Artificial Intelligence. Palo Alto: AAAI Press，2010 
994-999. 

Van den Assem M J, Van Dolder D, Thaler R H. Split or steal? Cooperative behavior when the 
stakes are large[J]]. Management Science, 2012, 58(1) : 2-20. 

Von Neumann, ]. Morgenstern, O. Theory of games and economic behavior[M]. New Jersey: 
Princeton University Press, 1944. 

阿 维 纳什 。 迪克 西 特 ,巴里 。 奈 尔 伯 夫 . 策略 思维 : 商界 、 政 界 及 日 常生 活 中 的 策略 竞争 LMJ. 北 
京 : 中 国人 民 大 学 出 版 社 , 2013. 

阿 维 纳什 。 迪 克 西 特 ,巴里 * 奈 尔 伯 夫 .妙趣 横生 博弈 论 [MJ. 北京 : 机 械 工业 出 版 社 , 2015. 

阿 维 纳什 "迪克 西 特 , 冯 曲 . 经 济 理论 中 的 最 优化 方法 LM]. 2 版 .上 海 : 上海 人 民 出 版 社 ，2006， 
保罗 。 米 格 罗 姆 . 拍卖 理论 与 实务 LM]. 杜 黎 , 胡 奇 英 ,等 , 译 . 北京 : 清华 大 学 出 版 社 , 2006. 
常 青 应 该 读 点 经 济 学 LM]. 北京 : 中 信 出 版 社 ，2009. 

陈 敏 . 不 存在 纯 策 略 纳 什 均衡 的 重复 博弈 [J]. 湖北 科技 学 院 学 报 , 2005, 25(6): 15-17. 

丹 ， 艾 瑞 里 .怪诞 行为 学 LM]. 北京 : 中 信 出 版 社 ， 2010. 

邓 力 平 ,安然 . 纳税 人 遵从 的 演化 博弈 分 析 [J]. 国际 税收 ，2006，215(5): 12-15. 

董 保 民 , 王 运通 , 郭 桂 霞 .合作 博弈 论 LMJ. 北京 : 中 国 市 场 出 版 社 ，2008. 

董 志 强 . 无 知 的 博弈 : 有 限 信息 下 的 生存 智慧 LMJ. 北京 : 机 械 工 业 出 版 社 , 2009. 

冯梦龙 , 蔡 元 放 .东周 列国 志 LMJ. 上 海 : 上 海 古籍 出 版 社 , 2012. 

葛 泽 慧 , 备 志 青 , 胡 奇 英 .竞争 与 合作 : 数学 模型 及 供应 链 管理 CMJ. 北京 : 科学 出 版 社 , 2011. 
葛 泽 慧 , 胡 奇 英 . 上 下 游 企业 间 的 研发 协作 与 产销 竞争 共存 研究 [J]. 管理 科学 学 报 ，2010， 
13(4) : 12-22. 

郭 其 友 , 李 宝 良 . 冲突 与 合作 : 博弈 理论 的 扩展 与 应 用 一 一 2005 年 度 诺 贝尔 经 济 学 奖 获得 者 奥 曼 
和 谢 林 的 经 济 理论 贡献 述评 [J]. 外 国 经 济 与 管理 , 2005, 27(11) : 1-11. 

何 维 ， 葛 林 . 合作 的 微观 经 济 学 LM]. 上海: 格致 出 版 社 ，2011. 

何 植 民 , 王 珂 . 国内 学 界 关于 非 理性 研究 综述 [站 . 前 沿 , 2009(12): 20-25. 

黄 凯 南 . 演化 博弈 与 演化 经 济 学 [站 . 经 济 研究 , 2009(2): 154-158. 

黄 凯 南 , 程 至 宇 . 认 知 理性 与 个 体 主义 方法 论 的 发 展 [J]. 经 济 研究 , 2008(7): 142-155. 

姜 黎 峙 . 论 市 场 经 济 与 宏观 调控 []]. 创造 ，1998(10) : 29-30. 

姜 树 广 , 韦 倩 . 信念 与 心理 博弈 : 理论 、 实 证 与 应 用 []J. 经 济 研究 , 2013(6): 141-154. 

蒋 国 云 , 蒋 裔 一 . 理性 有限 理性 和 非 理性 []]. 世界 经 济 情况 , 2005(14): 28-31. 

蒋 正 峰 , 贺 寿 南 . 博弈 论 中 的 理性 问题 分 析 [JJ. 华南 师范 大 学 学 报 ( 社 会 科学 版 )，2009 (1): 
49-52. 

焦 宝 聪 , 陈 兰 平 , 方 海光 . 博弈 论 : 思想 方法 及 应 用 LMJ. 北京 : 中 国人 民 大 学 出 版 社 , 2013. 

金 雪 军 , 余 津津 . 信息 不 对 称 、 声 誉 效应 与 合作 均衡 一 一 以 eBay 在 线 竞标 多 人 重复 博弈 为 例 [LJ]. 


[75 
[76 
[77 
本 
[79 
[80 
[81 
E82 
[83 
[84 


有 和 


[85] 


参考 文献 323 


社会 科学 战线 , 2004(1) : 70-75. 

克 里 斯 汀 。 蒙特, 丹尼尔. 塞 拉 . 博弈 论 与 经 济 学 [Mj]. 北京 : 经 济 管理 出 版 社 , 2011. 

李 军 林 , 郭 亚 玲 . 理性 ,均衡 与 演进 博弈 论 一 一 一 个 关于 博弈 理论 发 展 的 评述 [JJ]. 南开 经 济 研究 ， 
2000(4) : 48-52. 

李 维 安 , 吴 德 胜 , 徐 卑 .网 上 交易 中 的 声誉 机 制 一 一 来 自 淘宝 网 的 证 据 [J]. 中 国 工商 管理 研究 前 
沿 , 2008, 10(3) : 36-46. 

罗伯特 。 吉 本 斯 . 博弈 论 基 础 [MI]. 北 京 : 中 国 社会 科学 出 版 社 , 2011. 

罗贯中 . 三 国 演义 LM]. 北京 : 人 民 文 学 出 版 社 ,2005. 

罗 杰 ，。 麦 凯 恩 .博弈 论 一 一 战略 分 析 入 门 [MJ. 北京: 机 械 工业 出 版 社 ，2006. 

罗 杰 , 迈 尔 森 . 博弈 论 : 矛盾 冲突 分 析 [LMJ. 北京 : 中 国人 民 大 学 出 版 社 , 2015. 

骆 戏 , 张 炎 , 张 洪 顺 .英国 4G 频谱 拍卖 带 来 的 思考 []]. 中 国 无 线 电 , 2013(3): 6-7. 

马 毅 华 . 频谱 拍卖 二 十 年 : 制度 化 已 形成 [中]. 通信 世界 , 2010(42): 17. 

南 旭 光 . 博弈 与 决策 LMJ. 北京 : 外 语 教学 与 研究 出 版 社 ，2012. 

潘 汉 中 , 陈 胶 , 马 静 洁 . 信号 交叉 口 行人 违章 过 街 从 众 心理 研究 [J]. 交通 运输 研究 ,2010(23): 
150-156. 

潘 天 群 . 博弈 生存 : 社会 现象 的 博弈 论 解读 [LMJ. 南京 : 凤凰 出 版 社 ，2010. 

平 新 乔 . 微观 经 济 学 十 八 讲 [MJ. 北京 : 北京 大 学 出 版 社 , 2001. 

乔 尔 。 沃 森 . 策略 : 博弈 论 导 论 LM]. 上 海 : 格致 出 版 社 , 2010. 

圣 铎 . 每 天 读 点 博弈 论 : 日 常生 活 中 的 博弈 策略 CMJ. 北京 : 中 国 华侨 出 版 社 ，2013. 

施 锡 欠 . 合作 博弈 引 论 LM]. 北京 : 北京 大 学 出 版 社 , 2012. 

苏 治 . 理性 与 非 理 性 的 博弈 : 现代 投资 决策 理论 的 演进 [J]. 求 是 学 刊 , 2011, 38(4): 70-76. 

王 春 永 . 博弈 论 的 诡计 全 集 [Mj. 北京 : 中 国 发 展 出 版 社 , 2011. 

王国 成 . 从 一 般 均衡 到 对 策 均衡 : 经 济 学 的 世纪 抉择 []. 天 津 社会 科学 ,2000 (1): 55-59. 

王 丽 颖 . 重复 博弈 : 信用 合作 的 逻辑 路 径 选择 [Dj. 长 春 : 吉林 大 学 ，2005. 

王 先 甲 , 刘 伟 兵 . 有 限 理 性 下 的 进化 博弈 与 合作 机 制 [J]. 上 海 理 工大 学 学 报 ，2011，33(6): 
679-686. 

王 先 甲 ,全 吉 , 刘 伟 兵 . 有 限 理性 下 的 演化 博弈 与 合作 机 制 研究 [J]. 系统 工程 理论 与 实践 ，2011 
(s1) : 82-93. 

王 饮 , 李 研 . 区 域 电力 市 场 中 发 电 商 竞价 策略 的 最 优 反应 动态 模型 [J]. 华北 电力 大 学 学 报 (自然 
科学 版 ), 2006，33(6) : 51-54. 

王 亚 楠 . 竞争 与 协同 的 博弈 策略 [J]. 中 外 企业 家 ,2013(13) : 73-74. 

王 则 柯 , 葛 菲 . 纳什 均衡 : 动态 博弈 的 初步 讨论 LM]. 上 海 : 上 海 科 学 技术 出 版 社 ，2009. 

王 泽 椰 . 生物 进化 论 的 发 展 及 其 哲学 思考 [JJ]. 大 众 科技 ,2008(3) : 171-172. 

吴 莉 婧 . 中 美 贸易 摩擦 的 博弈 分 析 []]. 人 民 论 坛 , 2012(8) : 164-165. 

西 尔 维 娅 ， 娜 萨 , 王 尔 山 .美丽 心灵 : 纳什 传 LM]. 上 海 : 上 海 科 技 教育 出 版 社 , 2014. 

肖 条 军 . 博弈 论 及 其 应 用 [MJ. 上 海 : 三 联 书 店 , 2004. 

小 约瑟夫 。 哈 林 顿 . 哈 林 顿 博弈 论 LM]. 北京: 中 国人 民 大 学 出 版 社 , 2012. 

谢 识 予 .有 限 理性 条 件 下 的 进化 博弈 理论 [站 . 上海 财 经 大 学 学 报 , 2001, 3(5) : 3-9. 

谢 识 予 . 经 济 博弈 论 LMJ. 3 版 . 上海: 复旦 大 学 出 版 社 ，2007. 

徐 心 和 , 王 艳 , 刘 纪 红 , 等 .博弈 论 的 里 程 碑 成 果 与 局 限 性 分 析 [Cj. 中 国 控制 与 决策 会 议 ,2008: 
1214-1219. 

许 裔 , 隆 武 华 . 西方 经 济 学 中 始终 存在 着 “自由 放任 ”与 “国家 宏观 调控 ”两 种 学 说 [J]. 财政 研究 ， 
1994(10) : 55-60. 


博弈 论 入 门 


姚 国庆 . 博弈 论 LM]. 北京 : 高 等 教育 出 版 社 , 2007. 

杨 懋 , 祁 守 成 . 囚徒 困 境 从 单 次 博弈 到 重复 博弈 [站 . 商业 时 代 ，2009(2) : 14-15. 

章平 . 信念 调整 ,学习 行为 和 均衡 收敛 的 博弈 模型 研究 进展 []]. 南京 社会 科学 , 2009(1): 37-43. 
赵 东 生 . 博弈 论 入门 LMDJ. 郑州 : 河南 科学 技术 出 版 社 , 2014. 

詹姆斯 、 D. 米 勒 . 活 学 活用 博弈 论 LM]. 北京 : 机 械 工业 出 版 社 ,2011. 

张维迎 . 博弈 论 与 信息 经 济 学 [Mj. 上 海 : 格致 出 版 社 , 2012. 

张维迎 . 博弈 与 社会 LMDJ .北京 : 北京 大 学 出 版 社 , 2013. 

张小娴 . 谢谢 你 离开 我 [MJ. 长 沙 : 湖南 文艺 出 版 社 , 2013. 

郑 也 夫 . 新 古典 经 济 学 “理性 ”概念 之 批判 [站 . 社会 学 研究 , 2000(4) : 7-15. 

中 国 科学 技术 协会 . 运筹 学 学 科 发 展 报告 : 2012-2013[LM]. 北京 : 中 国 科学 技术 出 版 社 , 2014. 
中 国 拍卖 行业 协会 . 拍卖 经 济 学 教程 CMJ. 北京 : 中 国 财政 经 济 出 版 社 , 2012. 

钟 永光 . 系统 动力 学 LM]. 北京: 科学 出 版 社 ,2013. 

朱 。 弗 登 博 格 ,让 ， 梯 若 尔 . 博弈 论 LM]. 北京 : 中 国人 民 大 学 出 版 社 , 2015. 

吴军 友 . 基于 最 优 反应 动态 机 制 的 发 电 商 竞价 策略 研究 [Dj]. 北京 : 华北 电力 大 学 ，2011. 


325 


致谢 


首先 ,感谢 我 们 的 家 人 ,感谢 他 们 的 付出 和 支持 ! 

其 次 ,感谢 广东 财经 大 学 囊 继 红 教 授 在 编写 过 程 中 的 建议 ; 感谢 北京 科技 大 学 许 纪 
倩 、 范 玉 妹 、 管 志 安 \ 冯 梅 、 张 文 新 、 王 未 卿 、 刘 祥 东 、 王 海风 等 老师 在 (博弈 论 入 门 ) 授 课 过 
程 中 的 建议 (排名 不 分 先后 )。 

再 次 ,感谢 关 吴 天 、 任 珂 、 胡 华 清 及 选课 学 生 们 的 后 期 建议 和 教学 反馈 。 

最 后 ,特别 感谢 何 维 达 、 谢 浸 教授 的 持续 支持 和 审阅 ,特别 感谢 本 书 编审 们 的 大 量 
工作 。 


326 


